Python 3.5.x、 Python 3.6.x 


及 更 新 版 本 的 内 置 对 象 和 标准 库 对 象 的 高 级 用 法 ， 注 重 Python 内 功 修炼 
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内 容 简 介 


全 书 共 13 章 ,面向 Python 3. 5. x、Python 3. 6. x 和 Python 3. 7. x, 重 点 关注 Python 内 置 对 象 和 标 
准 库 对 象 的 高 级 应 用 以 及 比较 前 沿 的 一 些 新 技术 ,偶尔 涉及 一 点 扩展 库 用 法 。 第 1 章 介绍 Python 语言 
编程 规范 与 代码 优化 建议 .开发 环境 配置 程序 伪 编 译 与 打包 。 第 2 章 详解 运算 符 与 内 置 函数 的 用 法 。 
第 3 章 详解 各 种 序列 对 象 、 推 导 式 、 切 片 和 序列 解 包 。 第 4 章 详解 选择 结构 和 循环 结构 ,关键 字 else、 
break 与 continue。 第 5 章 详解 函数 的 基本 用 法 ,可 调用 对 象 与 修饰 器 函数 参数 ,变量 的 作用 域 , 生 成 器 
函数 ,lambda 表达 式 ,函数 柯 里 化 、 泛 型 函数 、 协 程 函 数 和 回调 函数 。 第 6 章 详 解 类 的 定义 ,不 同类 型 的 
成 员 、 依 赖 注 人 技术 和 运算 符 重 载 。 第 7 章 详解 字符 串 编码 与 格式 化 方法 .字符 串 对 象 方法 、 文 本 排版 
与 压缩 ,汉字 拼音 有 关 的 技术 。 第 8 章 详解 正则 表达 式 语 法 re 模块 .正则 表达 式 对 象 与 match 对 象 。 
第 9 章 详解 文件 对 象 用 法 ,文件 内 容 操作 。 第 10 章 详解 文件 与 文件 夹 操 作 。 第 11 章 详解 异常 处 理 结 
构 文档 测试 与 单元 测试 覆盖 测试 与 软件 性 能 测试 ,代码 调试 技术 。 第 12 章 详解 不 同类 型 的 并 行 处 理 
技术 。 第 13 章 详解 asyncio 提供 的 网 络 通信 功能 。 

本 书 不 但 可 以 作为 Python 程序 设计 教材 ,还 可 作为 Python 开发 工程 师 的 指导 用 书 。 
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作者 第 一 次 接触 Python 大 概 是 在 2002 年 ,在 几 个 著名 的 安全 网 站 上 看 到 有 人 用 这 
个 语言 ,当时 的 作者 正 痴 迷 于 C 语言 和 汇编 语言 ,内 心 不 悄 于 学 习 这 种 脚本 语言 。2010 
年 的 时 候 因 为 要 用 IDA Pro 分 析 一 个 PE 文件 而 不 得 不 借助 于 IDAPython 插件 , 才 真 正 
感觉 到 了 Python 的 方便 与 强大 ,于 是 购买 了 很 多 书籍 并 且 阅 读 了 大 量 在 线 文 档 开 始 系 
统 地 学 习 Python。2013 年 学 校 组 织 各 专业 教研 室 修 订 新 版 人 才 培 养 方案 时 ,经 过 慎重 
考虑 并 且 与 其 他 几 位 老师 进行 了 多 次 沟通 ,最 终 确定 为 数字 媒体 技术 专业 和 服务 外 包 专 
业 增 加 了 “Python 程序 设计 ”这 门 课程 。 然 而 ,虽然 当时 市 面 上 已 经 有 了 一 些 Python 书 
籍 ,但 是 适合 作为 教材 的 却 密 罕 无 几 ,有 的 过 于 专注 某 个 专业 领域 ,有 的 则 是 泛泛 地 介绍 
一 点 皮毛 ,并 且 很 多 书 里 放置 的 插图 占用 了 大 量 篇 幅 ,知识 密度 很 小 ,不 是 作者 喜欢 的 风 
格 。 在 翻 看 了 超过 20 本 Python 图 书 以 后 ,作者 决定 动手 写 一 本 适合 作 教材 的 书 , 于 是 就 
有 了 面向 计算 机 及 相关 专业 的 《Python 程序 设计 》( 书 号 为 9787302407232,2015 年 8 月 
出 版 ) 和 面向 非 计 算 机 专业 的 《Python 程序 设计 基础 》( 书 号 为 9787302410584,2015 年 8 
月 出 版 ,2016 年 3 月 第 2 次 印刷 ,2017 年 1 月 第 3 次 印刷 ), 前 者 主要 介绍 Python 2.7.x 
的 基本 语法 以 及 在 各 领域 的 应 用 ,后 者 主要 介绍 Python 3.4.x 的 基本 语法 而 没有 涉及 太 
多 的 应 用 。 本 来 当时 写 这 两 本 书 的 目的 仅仅 是 为 了 自己 上 课 用 起 来 方便 ,然而 出 版 不 到 
一 年 就 被 近 30 所 院 校 选 作 教材 ,还 有 几 十 所 院 校 的 图 书馆 也 采购 了 这 两 本 书 供 学 生 借 
阅 ,反响 非常 好 。 应 广大 读者 和 用 书 老师 的 要 求 , 也 为 了 紧 跟 Python 飞速 发 展 的 步伐 ， 
作者 于 2016 年 6 月 又 出 版 了 《Python 程序 设计 (第 2 版 )》( 书 号 为 9787302436515) ,这 本 
书 使 用 Python 3. 5.x 重 写 了 第 1 版 中 的 所 有 案例 ,并 且 新 增 案例 近 百 个 ,出 版 后 迅速 被 
多 所 院 校 选 作 教材 ,各 大 网 上 书店 也 频频 缺 货 ,2016 年 11 月 初 进行 了 第 2 次 印刷 ,2017 
年 3 月 进行 了 第 3 次 印刷 。 考 虑 到 更 多 的 Python 爱好 者 并 没有 听 老 师 讲课 的 机 会 ,看 教 
材 自学 可 能 比较 吃力 ,作者 于 2017 年 1 月份 出 版 了 《Python 可 以 这 样 学 》( 书 号 为 
9787302456469) ,全 书 500 多 页 ,使 用 生动 活泼 的 语言 讲解 Python 3. 5. x 的 知识 和 应 用 
( 绝 大 部 分 内 容 也 适用 于 Python 3. 6. x 和 Python 3. 7. x) ,在 《Python 程序 设计 (第 2 
版 )》 的 基础 上 删 掉 了 “软件 分 析 与 逆向 工程 ”> 和 “ 安 卓 平台 的 Python 编程 ?内容 ,新 增 了 
大 量 案例 ,并 且 融 入 了 道德 经 \. 周 易 、 太 极 源 理论 中 的 核心 思想 以 及 大 量 中 外 名 人 名 言 , 通 
过 小 提示 、 小 技巧 、 注 意 、 拓 展 知识 等 多 种 形式 扩充 了 大 量 知 识 ,尤其 适合 Python 爱好 者 
自学 ,也 可 作为 进 阶 工具 书 进 行 查阅 。 该 书 出 版 之 后 迅速 得 到 社会 各 界 人 士 的 一 致 认可 ， 
第 一 批 印刷 的 书 很 快 被 抢购 一 空 ,不 到 两 个 月 就 进行 了 第 二 次 印刷 。 回 头 想 想 , 自 己 二 十 
年 如 一 日 地 每 天 熬夜 看 书 学 习 写 代码 还 是 值得 的 。 
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当 2016 年 6 月 份 作者 前 几 本 Python 系列 图 书 的 责任 编辑 白 立 军 老师 约 作者 再 编写 
一 本 面向 高 级 程序 员 的 Python 图 书 时 ,说 实话 ,内 心 是 喜悦 的 ,很 高 兴 自己 的 努力 得 到 
广大 Python 爱好 者 的 认可 。 但 同时 作者 内 心 也 有 些 担心 ,感觉 在 写 前 4 本 书 时 已 经 用 完 
了 自己 的 洪荒 之 力 。 在 这 本 新 书 里 再 写 点 什么 好 呢 ? 内 容 该 如 何 组 织 呢 ? 如 何 避 免 过 多 
地 重复 利用 前 几 本 书 里 的 案例 呢 ? 反复 思考 了 近 2 个 月 ,考虑 目前 很 多 Python 程序 员 的 
现状 :喜欢 直接 使 用 各 种 扩展 库 来 解决 问题 ,不 重视 对 Python 语言 本 身 的 理解 ,内 功 不 
够 深厚 ,导致 很 多 代码 粗制滥造 。 最 终 作 者 做 出 决定 ,在 这 本 新 书 里 ,不 再 介绍 太 多 扩展 
库 的 应 用 ,而 是 把 重点 放 在 Python 语法 和 内 置 对 象 、 标 准 库 对 象 的 高 级 应 用 上 ,注重 
Python 的 内 涵 , 注 重 内 功 的 修炼 ,尽量 往 纵深 发 展 ,争取 用 最 简练 的 语言 介绍 那些 作者 认 
为 比较 高 级 的 用 法 。 在 编写 过 程 中 ,尽量 减少 与 前 几 本 书 中 内 容 的 重复 ,补充 大 量 新 案例 
和 高 级 用 法 。 当 然 , 前 面 几 本 书 里 的 有 些 案例 在 这 本 书 里 又 出 现 了 ,但 是 仔细 的 读者 应 该 
能 发 现 , 很 多 案例 代码 都 进行 了 必要 的 改写 和 优化 ,更 加 Pythonic, 更 加 优雅 和 高 效 。 自 
从 答应 了 写 这 本 书 之 后 ,作者 在 不 影响 正常 教学 和 科研 工作 的 情况 下 每 天 拿 出 至 少 10 个 
小 时 查阅 资料 编写 代码 或 者 整理 书稿 ,前 后 用 了 一 年 左右 的 时 间 , 现 在 回头 想 想 也 插值 
得 ,在 整理 资料 和 编写 案例 代码 的 同时 作者 自己 也 进步 了 很 多 ,对 Python 有 了 更 加 深入 
的 认识 和 理解 。 


内 容 组 织 与 阅读 建议 


全 书 共 13 章 ,面向 Python 3.5.x、Python 3. 6.x 和 Python 3.7.x, 重 点 关注 Python 
内 置 对 象 和 标准 库 对 象 的 高 级 应 用 ,以 及 比较 前 沿 的 、 刚 刚 引入 的 一 些 新 技术 和 新 特性 的 
用 法 ,偶尔 涉及 一 些 扩展 库 用 法 。 几 乎 每 个 知识 点 都 配 有 大 量 的 案例 ,把 这 些 案例 简单 拼 
凑 和 集成 就 可 以 实现 很 多 功能 ,实用 性 非常 强 。 建 议 读 者 按 章节 顺序 阅读 ,并 且 前 后 结合 
地 反复 阅读 ,不 要 随意 跳 过 任何 内 容 , 或 许 不 经 意 间 会 发 现 自 己 正 需要 的 知识 或 者 得 到 某 
种 灵感 。 另 外 ,虽然 本 书 的 定位 是 Python 高 级 编程 ,但 也 同样 适用 于 初学 者 ,请 初学 者 
不 要 觉得 有 压力 ,如 果 有 些 地 方 暂时 看 不 懂 , 可 以 先 跳 过 去 ,或 许 过 几 天 再 看 就 明白 了 。 
当然 ,如 果实 在 看 不 懂 的 话 , 及 时 和 作者 沟通 应 该 会 得 到 帮助 。 

第 1 章 管中窥豹 :Python 概述 。 介 绍 Python 语言 的 特点 与 主流 版 本 ,编程 规范 与 
代码 优化 建议 ,虚拟 开发 环境 的 创建 与 配置 ,扩展 库 的 安装 方法 ,开发 与 发 布 自 己 的 包 ， 
Python 程序 伪 编 译 与 打包 ,从 命令 行 和 外 部 文件 获取 配置 信息 。 

第 2 章 万 丈 高 楼 平地 起 :运算 符 、 表 达 式 与 内 置 对 象 。 详 细 介 绍 Python 的 运算 符 
与 内 置 函数 的 用 法 ,以 及 变量 与 常量 的 概念 。 

第 3 章 玄 之 又 玄 , 众 妙 之 门 :详解 Python 序列 结构 。 详 解 列 表 、 元 组 、 字 典 、 集 合 等 
对 象 的 特点 与 用 法 ,列表 推导 式 、 生 成 器 推导 式 、 字 典 推导 式 与 集合 推导 式 , 切 片 操 作 , 序 
列 解 包 , 枚 举 、 数 组 .队列 、 堆 等 常用 结构 用 法 。 

第 4 章 反 者 , 道 之 动 :程序 控制 结构 。 详 解 Python 中 的 选择 结构 和 循环 结构 ,else 
的 几 种 用 法 ,选择 结构 的 多 种 实现 方式 ,break 与 continue 语句 ,循环 结构 的 代码 优化 
技巧 。 

第 5 章 代码 复 用 技术 (一 ) :函数 。 详 解 函数 的 定义 与 区 套 定 义 语 法 ,可 调用 对 象 与 
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修饰 器 原理 ,位 置 参 数 、 默 认 值 参数 、 关 键 参 数 以 及 参数 的 序列 解 包 , 局 部 变量 、 全 局 变量 
与 nonlocal 变量 ,生成 器 函数 ,lambda 表达 式 ,函数 柯 里 化 , 泛 型 函数 , 协 程 函数 ,回调 
函数 。 

第 6 章 ”代码 复 用 技术 (二 ): 面 向 对 象 程序 设计 。 详 解 类 的 定义 语法 与 实例 化 方法 ， 
数据 成 员 、 成 员 方 法 、 属 性 以 及 静态 方法 与 类 方法 ,继承 与 多 态 , 依 赖 注入 技术 的 Python 
实现 ,特殊 成 员 重 写 与 运算 符 重 载 。 

第 7 章 文本 处 理 ( 一 ) :字符 串 。 详 解 字符 串 编 码 与 字符 串 格 式 化 方法 、 字 符 串 对 象 
方法 、 文 本 排版 与 压缩 ,分词 .汉字 拼音 有 关 的 技术 。 

第 8 章 文本 处 理 ( 二 ): 正 则 表达 式 。 详 解 正则 表达 式 基本 语法 与 扩展 语法 ,正则 表 
达 式 模块 re 的 用 法 ,正则 表达 式 对 象 与 match 对 象 的 用 法 。 

第 9 章 数据 永久 化 :文件 内 容 操作 。 详 解 内 置 函数 open() 与 上 下 文 管理 语句 with 
的 用 法 ,文本 文件 与 二 进 制 文件 的 操作 ,Excel、Word、zip、rar 等 常见 二 进 制 文件 操作 
技术 。 

第 10 章 文件 与 文件 夹 操作 。 详 解 os、os. path、shutil、glob、fnmatch 等 模块 在 文件 
与 文件 夹 操作 方面 的 用 法 。 

第 11 章 代码 质量 保障 :异常 处 理 结 构 \、 程 序 调试 与 测试 。 详 解 异常 处 理 结构 ,文档 
测试 与 单元 测试 技术 ,覆盖 测试 与 软件 性 能 测试 技术 ,IDLE、pdb、Eclipse 十 Pydev 等 不 同 
的 代码 调试 技术 。 

第 12 章 多 任务 与 并 行 处 理 :线程 .进程 、 协 程 \、 分 布 式 .GPU 加 速 。 详 解 多 线程 与 
多 进程 编程 技术 ,线程 与 进程 的 同步 技术 ,不 同 进程 间 数 据 交 换 与 共享 技术 , 协 程 ,spark 
并 行 计算 与 GPU 编程 。 

第 13 章 互通 互联 :asyncio 提供 的 网 络 通信 功能 。 详 解 asyncio 提供 的 网 络 通信 功 
能 ,重点 介绍 Transport、Protocol、StreamReader 以 及 StreamWriter 等 类 的 用 法 。 


配套 资源 


本 书 提 供 所 有 案例 源 代 码 , 可 以 登录 清华 大 学 出 版 社 网 站 (www.tup. com. cn) 下 载 ， 
或 加 入 本 书 读者 群 (QQ 群 号 456324891, 加 入 时 请 注 明 是 读者 ,如 果 这 个 群 满 了 的 话 会 在 
群 简介 中 给 出 下 一 个 群 号 ) 下 载 最 新 配套 资源 并 与 作者 交流 ,当然 也 欢迎 关注 微 信 公 众 号 
“Python 小 屋 ” 及 时 阅读 作者 写 的 最 新 案例 代码 ,有 些 代码 是 在 本 书 完稿 之 后 新 写 的 ,是 
书 上 没有 的 , 算 作 是 一 个 很 好 的 补充 。 


适用 读者 
。 已 经 具有 一 定 Python 水 平 的 软件 开发 工程 师 。 
。 打 算 深入 探究 Python 高 级 编程 的 狂热 爱好 者 。 


。 各 专业 研究 生 、 本 科 生 、 专 科 生 的 程序 设计 教材 。 
。 可 能 有 些 内 容 看 起 来 会 稍微 有 些 吃 力 的 其 他 Python 初学 者 。 
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第 工 章 
eS 管 中 宕 鹏 : Python 概述 
fl 


1.1 Python 是 这 样 一 种 语言 


有 不 少 人 说 Python 是 一 种 "大 蟒蛇 语言 " 。 虽 然 在 英语 中 Python 确实 有 大 蟒蛇 的 意 
思 , 但 Python 语言 和 大 蟒蛇 却 没有 任何 关系 。Python 语言 的 名 字 来 自 于 一 个 著名 的 电视 
剧 Monty Python 's Flying Circus ,Python 之 父 Guido van Rossum 是 这 部 电视 剧 的 狂热 爱好 
者 ,所 以 把 他 设计 的 语言 命名 为 Python。 

也 有 人 说 Python 是 一 门 脚本 语言 ,这 也 是 不 准确 的 , 远 远 不 足以 反映 Python 的 强大 。 
Python 并 不 仅仅 是 一 门 脚本 语言 ,更 是 一 门 跨 平台 ,开源 、 免 费 的 解释 型 高 级 动态 编程 语 
言 , 是 一 种 通用 编程 语言 。 除 了 可 以 解释 执行 之 外 ,Python 还 支持 将 源 代码 伪 编 译 为 字 节 
码 来 优化 程序 提高 运行 速度 并 对 源 代 码 进 行 保密 ,也 支持 使 用 py2exe、pyinstaller、cx_ 
Freeze 或 其 他 类 似 工 具 将 Python 程序 及 其 所 有 依赖 库 打包 成 为 各 种 平台 上 的 可 执行 文 
件 , 当 然 也 包括 扩展 名 为 exe 的 Windows 可 执行 程序 ,从 而 可 以 脱离 Python 解释 器 环境 和 
相关 依赖 库 ,能 够 在 Windows 平台 上 独立 运行 ,并 且 还 支持 制作 成 . msi 安装 包 ;Python 支 
持 命令 式 编程 (How to do) 和 函数 式 编程 (What to do ) 两 种 方式 ,完全 支持 面向 对 象 程序 
设计 (虽然 并 不 强制 要 求 处 处 体现 面向 对 象 编程 的 思想 和 有 关 特 征 , 但 实际 上 人 们 无 时 
无 刻 不 在 使 用 ) ,语法 简洁 清晰 ,功能 强大 且 易 学 易 用 ,更 重要 的 是 拥有 大 量 的 几乎 支持 
所 有 领域 应 用 开发 的 成 熟 扩 展 库 和 狂热 支持 者 。 

当然 ,也 有 人 喜欢 把 Python 称 为 “胶水 语言 " ,这 确实 是 Python 的 重要 特点 之 一 , 它 可 
以 把 多 种 不 同 语言 编写 的 程序 融合 到 一 起 实现 无 缝 拼接 ,更 好 地 发 挥 不 同 语言 和 工具 的 
优势 ,满足 不 同 应 用 领域 的 需求 。 






1.2 ”Python 版 本 之 争 


众所周知 ,Python 官方 网 站 同时 发 行 和 维护 着 Python 2. x 和 Python 3. x 两 个 不 同系 
列 的 版 本 ,并 且 版 本 更 新 速度 非常 快 (6 个 月 左右 更 新 一 次 小 版 本 号 ) 。 目 前 最 新 版 本 分 
别 是 Python 2.7. 13 .Python 3.4.6 .Python 3.5.3 和 Python 3.6. 1,Python 3.7 已 在 研发 中 ， 
估计 很 快 就 会 推出 。Python 2. x 和 Python 3. x 这 两 个 系列 的 版 本 之 间 很 多 用 法 是 不 兼容 
的 (让 人 欣慰 的 是 ,除了 一 些 新 特性 .运算 符 和 标准 库 对 象 之 外 ,同一 个 系列 的 不 
同 版 本 之 间 绝 大 多 数 用 法 是 完全 一 致 的 ) ,除了 基本 输入 输出 方式 有 所 不 同 , 很 多 内 置 函 
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数 和 标准 库 对 象 的 用 法 也 有 非常 大 的 区 别 ,Python 3. x 在 增加 了 很 多 新 标准 库 的 同时 也 
删除 了 一 些 Python 2. x 的 标准 库 ,还 有 些 Python 2. x 的 标准 库 在 Python 3. x 中 进行 了 合 
并 和 拆 分 。 当 然 , 适 用 于 Python 2. x 和 Python 3. x 的 扩展 库 之 间 更 是 差别 巨大 ,这 应 该 是 
现 有 系统 进行 版 本 迁移 时 最 大 的 障碍 。 因 此 ,在 正式 开始 使 用 Python 之 前 ,必须 要 选择 
合适 的 版 本 ,以 免 浪 费时 间 。 

在 选择 Python 版 本 的 时 候 , 一 定 要 先 考 虑 清楚 自己 学 习 Python 的 目的 是 什么 ,打算 
做 哪 方面 的 开发 ,该 领域 或 方向 有 哪些 扩展 库 可 用 ,这 些 扩展 库 最 高 支持 哪个 版 本 的 
Python ,是 否 还 在 维护 和 更 新 。 这 些 问题 全 部 明确 以 后 ,再 最 终 确 定 选 择 哪个 版 本 ,这 样 
才能 事半功倍 ,而 不 至 于 把 太 多 时 间 浪 费 在 Python 以 及 各 种 扩展 库 的 反复 安装 和 和 缉 载 
上 ,虽然 这 并 不 是 非常 麻烦 。 另 外 , 当 较 新 的 Python 版 本 推出 之 后 ,不 要 急于 安装 ,而 是 
应 该 在 确定 自己 所 必须 使 用 的 扩展 库 也 推出 了 与 之 匹配 的 稳定 版 本 之 后 再 一 起 进行 
更 新 。 

总 体 来 看 ,Python 3. x 的 设计 理念 更 加 合理 ,高效 和 人 性 化 ,全 面 普 及 和 应 用 是 必然 
的 , 越 来 越 多 的 扩展 库 也 以 非常 快 的 速度 推出 了 与 最 新 Python 版 本 相 适 应 的 版 本 。 如 果 
暂时 还 没 想 到 要 做 什么 行业 领域 的 应 用 开发 ,或 者 仅仅 是 为 了 尝试 一 种 新 的 .好 玩 的 语 
言 ,那么 请 毫 不 犹 列 地 选择 Python 3. x 系列 的 最 高 版 本 。 


1.3 Python 编程 规范 与 代码 优化 建议 


没有 规矩 ,不 成 方圆 。 任 何 一 种 语言 都 有 一 些 约定 俗 成 的 编码 规范 ,Python 也 不 例 
外 。Python 非常 重视 代码 的 可 读 性 ,对 代码 布局 和 排版 有 更 加 严格 的 要 求 。 虽 然 一 些 大 
型 软件 公司 对 自己 公司 程序 员 编 写 的 代码 在 布局 .结构 ,标识 符 命名 等 方面 有 一 些 特殊 的 
要 求 ,但 其 中 很 多 思想 是 相同 的 ,目的 也 是 一 致 的 。 这 里 重点 介绍 Python 社区 对 代码 编 
写 的 一 些 共同 的 要 求 .规范 和 一 些 常用 的 代码 优化 建议 ,最 好 在 开始 编写 第 一 段 代码 的 时 
候 就 要 遵循 这 些 规 范 和 建议 , 养 成 一 个 好 的 习惯 。 

(1) 严格 使 用 缩 进来 体现 代码 的 逻辑 从 属 关 系 。Python 对 代码 缩 进 是 硬性 要 求 ,这 
一 点 必须 时 刻 注意 。 如 果 某 个 代码 段 的 缩 进 不 对 ,那么 整个 程序 就 是 错 的 ,要 么 是 语法 错 
误 无 法 执行 ,要 么 是 逻辑 错误 导致 错误 结果 ,而 检查 这 样 的 错误 会 花费 很 多 时 间 。 

(2) 每 个 import 语句 只 导入 一 个 模块 ,最 好 按 标准 库 .扩展 库 、 自 定义 库 的 顺序 依次 
导入 。 尽 量 避 免 导 入 整个 库 , 最 好 只 导入 确实 需要 使 用 的 对 象 ,这 会 让 程序 运行 更 快 。 

(3) 最 好 在 每 个 类 、 函 数 定义 和 一 段 完 整 的 功能 代码 之 后 增加 一 个 空 行 ,在 运算 符 两 
侧 各 增加 一 个 空格 ,逗号 后 面 增加 一 个 空格 。 按 照 这 样 的 规范 写 出 来 的 代码 布局 和 排版 
比较 松散 ,阅读 起 来 更 加 轻松 。 不 论 是 前 面 第 一 条 讲 的 缩 进 ,还 是 这 里 谈 的 空 行 与 空 
主要 是 提高 代码 可 读 性 ,正如 The Zen of Python 所 说 : Sparse is better than dense、 
Readability counts。 稍 微 有 点 例外 的 是 ,在 正常 的 赋值 表达 式 中 等 号 两 侧 都 是 各 增加 一 个 
空格 ,但 在 定义 函数 的 默认 值 参数 和 使 用 关键 参数 调用 函数 时 一 般 并 不 在 参数 赋值 的 等 
号 两 侧 增加 空格 。 这 样 松 中 有 紧 也 是 为 了 提高 代码 的 可 读 性 , 正 所 谓 “ 张 而 不 弛 ,文武 弗 
能 也 ; 弛 而 不 张 ,文武 弗 为 也 ;一 张一弛 ,文武 之 道 也 。” 
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(4) 尽量 不 要 写 过 长 的 语句 。 如 果 语 句 过 长 ,可 以 考虑 拆 分 成 多 个 短 一 些 的 语句 ,以 
保证 代码 具有 较 好 的 可 读 性 。 如 果 语 句 确 实 太 长 而 超过 屏幕 宽度 ,最 好 使 用 续 行 符 (line 
continuation character)“\”, 或 者 使 用 圆 括号 将 多 行 代码 括 起 来 表示 是 一 条 语句 。 

(5) 虽然 Python 运算 符 有 明确 的 优先 级 ,但 对 于 复杂 的 表达 式 建 议 在 适当 的 位 置 使 
用 括号 使 得 各 种 运算 的 隶属 关系 和 顺序 更 加 明确 ,正如 The Zen of Python 所 说 : Explicit is 
better than implicit 。 

(6) 对 关键 代码 和 重要 的 业务 逻辑 代码 进行 必要 的 注释 。 统 计数 据 表 明 ,一 个 可 读 
性 较 好 的 程序 中 应 包含 大 概 30% 以 上 的 注释 。 在 Python 中 有 两 种 常用 的 注释 形式 : # 和 
三 引号 。# 用 于 单行 注释 ,三 引号 常用 于 大 段 说 明 性 文本 的 注释 。 

(7) 在 开发 速度 和 运行 速度 之 间 尽 量 取得 最 佳 平 衡 。 内 置 对 象 运行 速度 最 快 , 标 
准 库 对 象 次 之 ,用 C 或 FORTRAN 编写 的 扩展 库 速度 也 比较 快 ,而 纯 Python 的 扩展 库 往 
往 速度 慢 一 些 。 因 此 ,在 开发 项 目 时 ,应 优先 使 用 Python 内 置 对 象 ,其 次 考虑 使 用 
Python 标准 库 提供 的 对 象 ,最 后 考虑 使 用 第 三 方 扩展 库 。 然 而 ,有 了 时候 只 使 用 内 置 对 象 
和 标准 库 对 象 的 话 ,很 可 能 无 法 直接 满足 需要 。 这 时 候 有 两 个 选择 : 一 是 使 用 内 置 
对 象 和 标准 库 对 象 编写 代码 实现 特定 的 逻辑 ;二 是 使 用 合适 的 扩展 库 对 象 。 至 于 如 
何 取舍 ,最终 还 是 取决 于 业务 逻辑 的 复杂 程度 和 对 运行 速度 的 要 求 这 两 者 之 间 的 
平衡 。 

(8) 根据 运算 特点 选择 最 合适 的 数据 类 型 来 提高 程序 的 运行 效率 。 加 第 年关 一 些 数 
据 只 是 用 来 频繁 遍历 ,最 好 优先 考虑 元 组 或 集合 。 如 果 需 要 频繁 地 测试 一 a 
在 于 一 个 序列 中 并 且 不 关心 其 位 置 ,尽量 采用 字 典 或 者 集合 。 列 表 和 元 组 的 in 操作 的 时 
间 复 杂 度 是 线性 的 ,而 对 于 集合 和 字典 却 是 常数 级 的 ,与 问题 规模 几乎 无 关 。 在 所 有 内 置 
数据 类 型 中 ,列表 的 功能 最 强大 ,但 开销 也 最 大 ,运行 速度 最 慢 , 应 慎重 使 用 。 作 为 建议 ， 
应 优先 考虑 使 用 集合 和 字典 ,元 组 次 之 ,最 后 再 考虑 列表 和 字符 串 。 

(9) 充分 利用 关系 运算 符 以 及 逻辑 运算 符 and 和 or 的 惰性 求 值 特点 ,合理 组 织 条 件 
表达 式 中 多 个 条 件 的 先后 顺序 ,减少 不 必要 的 计算 。 

(10) 充分 利用 生成 器 对 象 或 类 似 迭 代 对 象 的 惰性 计算 特点 ,尽量 避免 将 其 转换 为 列 
表 .元 组 等 类 型 ,这 样 可 以 减少 对 内 存 的 占用 ,降低 空间 复杂 度 。 

(11) 减少 内 循环 中 的 无 关 计 算 , 尽 量 往 外 层 提取 。 

有 很 多 成 熟 的 工具 可 以 检查 Python 代码 的 规范 性 ,例如 pep8 、flake8 、pylint 等 。 可 以 
使 用 pip 来 安装 pep8 工具 ,然后 使 用 命令 pep8 test. py 来 检查 test. py 文件 中 Python 代码 
的 规范 性 。pep8 常用 的 可 选 参数 有 --show-source 、--first 、--show-pep8 等 。flake8 结合 
pyflakes 和 pep8 的 特点 ,可 以 检查 更 多 的 内 容 , 优 先 推荐 使 用 ,使 用 pip install flake8 可 以 
直接 安装 ,然后 使 用 命令 flake8 test. py 检查 test. py 中 代码 的 规范 性 。 也 可 以 使 用 pip 安 
装 pylint, 然 后 使 用 命令 行 工 具 pylint 或 者 可 视 化 工具 pylint-gui 来 检查 程序 的 规范 性 。 


1.4 Python 虚拟 开发 环境 的 搭建 


Python 支持 创建 多 个 虚拟 环境 ,每 个 虚拟 环境 都 是 包含 Python 主 程序 和 相应 扩展 库 
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的 一 个 文件 夹 ,每 个 虚拟 环境 都 是 独立 的 ,多 个 虚拟 环境 之 间 互 相 不 干扰 ,可 以 安装 不 同 
版 本 的 Python 解释 器 和 扩展 库 。 下 面 通过 一 个 实际 的 例子 来 演示 如 何 创 建 和 使 用 
Python 虚拟 环境 ,首先 进入 命令 提示 符 环 境 并 切换 至 Python 安装 目录 的 tools\Scripts 文件 
夹 ,然后 执行 下 面 的 命令 : 

-VEython Pyverv .py -YNPYython cbcx 

稍 等 片刻 , 当 再 次 出 现 命令 提示 符 的 时 候 就 表明 Python 虚拟 环境 创建 成 功 了 ， 
接 下 来 使 用 cd 命令 切换 至 Python_docx\Seripts 文件 夹 中 ,执行 activate 命令 ,如 成 功 
就 会 发 现 前 面 的 提示 符 有 些 变化 。Python 虚拟 环境 的 创建 和 使 用 主要 步骤 如 图 1-1 
所 示 。 















:NUsers\Dongycd \python 3.5\tools\scripts 
:Python 3.5\Tools\scripts>.-.\-- Python pyvenv.py .-\.-\Python_docx 
:\Python 3-5\Tools\scriptsycd - 改 --\Python_docxvscripts 

:\Python 3.5\Python_docx\Scripts>dir pw-exe 

i 

C:\Python 3.5\Python_docx\Scripts 的 目录 

G16-11-21 89:59 98 -148 pip-exe 
G16-11-21 89:59 5- 
G16-11-21 89:59 
G16—11-21 09:59 
G16-11-21 89: 41- 4 yehony exe 


s 信和 15.827. ee 将 人 和 


:\Python 3.5\Python_docxNScriptsyecho printC’hello world'》》test-py 





:\Python 3.5\Python_docx\Scripts>python test-py 
llo world 


:\Python 3.5\Python_docx Scripts activate 
KPython_docx) C:\Python 3-5\Python_docxNScriptsyjpython test-py 
TI world 

















KPython_docx> C:\Python 3.5\Python_docx\Scripts> 








图 1-1 Python 虚拟 环境 创建 和 使 用 


1.5 Eclipse + PyDev 环境 搭建 和 使 用 


其 实 作 者 更 喜欢 使 用 IDLE 来 写 Python 代码 ,之 前 的 几 本 书 上 所 有 案例 代码 都 是 
用 IDLE 写 的 ,作者 开发 的 一 套 “ 边 讲 边 练 类 课程 教学 管理 系统 "也 是 完全 用 IDLE 写 
的 。 其 实 , Python 解释 器 python. exe 才 是 根本 , PyCharm、wingIDE、PythonWin 、 
Eclipse + PyDev 、Eric 或 其 他 IDE 开发 环境 不 过 是 对 其 进行 了 一 定 的 封装 ,还 有 些 像 
Anaconda .Python(x,y) .zwPython 之 类 的 开发 环境 集成 了 一 些 常 用 的 或 者 特定 领域 的 
扩展 库 , 所 有 这 些 都 是 为 了 使 得 安装 和 开发 过 程 更 加 愉快 而 已 ,当然 这 一 点 也 很 重要 。 
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为 了 让 自己 表现 得 像 一 个 Python 高 手 , 本 书 有 些 代码 作者 选择 使 用 Eclipse + PyDev, 虽 
然 这 在 很 多 时 候 并 没有 必要 ,也 显示 不 出 这 个 开发 环境 的 优势 ,但 不 得 不 说 ,在 开发 大 
型 项 目 时 ,这 些 带 着 外 挂 的 开发 环境 确实 比 IDLE 方便 一 些 ,尤其 是 标识 符 的 自动 识别 
和 提醒 功能 可 以 减少 很 多 拼写 错误 ,而 这 在 实际 开发 中 是 经 常 出 现 的 一 种 错误 。 书 中 
一 些 演示 性 和 验证 性 的 小 代码 片段 仍 使 用 了 IDLE ,当然 大 家 也 可 以 使 用 自己 喜欢 的 开 
发 环境 ,作者 觉得 没 必 要 在 这 个 问题 上 纠结 。 

我 们 有 理由 相信 ,能 选择 和 阅读 本 书 的 朋友 应 该 已 经 具有 了 一 定 的 计算 机 应 用 水 平 ， 
完全 可 以 非常 顺利 地 安装 和 配置 Eclipse + PyDev 环境 ,所 以 这 里 只 把 关键 的 步骤 介绍 
一 下 。 

首先 安装 合适 版 本 的 Eclipse 和 Java JDK, 然 后 打开 Eclipse ,依次 单 击 菜单 Help 一 
Install New Software ,在 弹出 的 窗口 中 单 击 Add 按钮 ,在 弹出 的 Add Repository 窗口 中 的 
Name 中 填写 PyDev ,在 Location 中 填写 http://pydev. org/updates ,如 图 1-2 所 示 。 接 下 来 
单 击 OK 按钮 后 再 单 击 Next 按钮 进行 安装 即 可 。 


Available Software 
Select a site or enter the location of a site- 











Work with: type or select a site - (= sd 


Find more software by working with the "Available Software Sites* preferences. 















Name: PyDev 
Location: http://pydev.org/updates [Aarchive-. | 





















@ 





Cor) Gece) 








加 Show only the latest versions of available software 。” 国 Hide items that are already install 
国 Group items by category What is already installed? 
回 show only software applicable to target environment 


图 1-2 安装 PyDev 


安装 完 之 后 需要 进行 简单 的 配置 才能 更 好 地 使 用 这 个 环境 ,依次 单 击 菜单 Window 一 
Preferences 打开 配置 窗口 ,然后 找到 PyDev 展开 后 进行 必要 的 配置 ,图 1-3 中 展示 了 如 何 
配置 Python 解释 器 版 本 ,这 是 非常 重要 的 一 项 配置 ,其 他 如 代码 颜色 .风格 以 及 编辑 器 的 
有 关 配 置 请 读者 自行 查阅 资料 ,然后 根据 自己 的 喜好 进行 配置 。 
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图 1-3 ”配置 Eclipse + PyDev 环境 


1.6 安装 扩展 库 的 几 种 方法 


除了 使 用 源码 安装 和 二 进 制 安装 包 ( 并 不 是 所 有 扩展 库 都 提供 这 种 方式 ) 以 外 ,easy_ 
install 和 pip 工具 已 经 成 为 管理 Python 扩展 库 的 主要 方式 ,其 中 pip 用 得 更 多 一 些 。 使 用 
pip 不 仅 可 以 查看 本 机 已 安装 的 Python 扩展 库 列表 ,还 支持 Python 扩展 库 的 安装 、 升 级 和 
凶 载 等 操作 。 使 用 pip 工具 管理 Python 扩展 库 只 需要 在 保证 计算 机 联网 的 情况 下 输入 几 
个 命令 即 可 完成 , 极 大 方便 了 用 户 。 常 用 pip 命令 的 使 用 方法 如 表 1-1 所 示 。 


表 1-1 常用 pip 命令 使 用 方法 














Pip 命令 示例 说 明 
pip download SomePackage[ = = version] 下 载 扩 展 库 的 指定 版 本 ,不 安装 
pip freeze 以 requirements 的 格式 列 出 已 安装 模块 
pip list 列 出 当前 已 安装 的 所 有 模块 
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续 表 
Pip 命令 示例 说 明 
pip install SomePackage[ = = version] 在 线 安装 SomePackage 模块 的 指定 版 本 
pip install SomePackage. whl 通过 whl 文件 离线 安装 扩展 库 
pip install packagel package2…- 依次 (在 线 ) 安装 packagel .package2 等 扩展 模块 
pip install -r requirements. txt 安装 requirements. txt 文件 中 指定 的 扩展 库 
pip install --upgrade SomePackage 升级 SomePackage 模块 
pip uninstall SomePackage[ = = version] 伯 载 SomePackage 模块 的 指定 版 本 





在 https://pypi. python. org/pypi 中 可 以 获得 一 个 Python 扩展 库 的 综合 列表 ,可 以 根 
据 需要 下 载 源码 进行 安装 或 者 使 用 pip 工具 进行 在 线 安装 ,也 有 一 些 扩 展 库 还 提供 了 
.whl 文件 和 . exe 文件 ,大 幅度 简化 了 扩展 库 的 安装 过 程 。 有 些 扩展 库 安装 时 要 求 本 机 已 
安装 相应 版 本 的 CLC ++ 编译 器 ,或 者 有 些 扩展 库 暂 时 还 没有 与 本 机 Python 版 本 对 应 的 官 
方 版 本 ,这 时 可 以 从 http://www. ld. uci. edu/ ~ gohlke/pythonlibs/ 下 载 对 应 的 . whl 文件 ( 
注意 ,不 要 修改 文件 名 ) ,然后 在 命令 提示 符 环 境 中 使 用 pip 命令 进行 安装 。 例 如 : 

Pip install pygeme 1 .9.2a0 -p35 -none -win ande4 .whl 

一 般 来 讲 , 使 用 pip 工具 在 线 安装 总 是 会 自动 选择 扩展 库 的 最 新 版 本 ,但 有 时 候 会 出 
现 新 版 本 与 其 他 扩展 库 不 兼容 的 情况 ,或 者 其 他 扩展 库 依赖 待 安装 扩展 库 的 较 低 版 本 ,这 
时 可 以 明确 指定 扩展 库 的 版 本 号 ,例如 : 

pip install reqnests= 过 .12.4 

如 果 需 要 安装 的 扩展 库 比 较 多 ,并 且 对 版 本 号 要 求 严 格 ,可 以 使 用 类 似 于 pip install - 
r requirements. txt 这 样 的 命令 从 requirements. txt 文件 中 读 取 所 需 安 装 的 扩展 库 信息 并 自 
动 安装 。 这 个 requirements. txt 可 以 手工 编辑 ,也 可 以 使 用 pip freeze > requirements. txt 命 
令 把 本 机 已 安装 模块 的 信息 快速 生成 为 requirements. txt 文件 。 在 命令 提示 符 环境 中 直 
接 执 行 pip 命令 可 以 查看 其 他 子 命令 ,例如 wheel。 然 后 执行 pip wheel -h 可 以 查看 子 命 
令 的 详细 用 法 ,不 再 歼 述 。 


1.7 标准 库 与 扩展 库 中 对 象 的 导入 与 使 用 


Python 默认 安装 仅 包含 基本 或 核心 模块 ,启动 时 也 仅 加 载 了 基本 模块 ,在 需要 时 再 显 
式 地 导入 和 加 载 标准 库 和 第 三 方 扩 展 库 , 这 样 可 以 减 小 程序 运行 的 压力 ,并且 具有 很 强 的 
可 扩展 性 。 从 “ 木 桶 原理 "的 角度 来 看 ,这 样 的 设计 与 安全 配置 时 遵循 的 “最 小 权限 "原则 
是 一 致 的 ,也 有 助 于 提高 系统 安全 性 。 如 果 需 要 的 话 , 可 以 使 用 sys. modules. items( ) 显示 
所 有 预 加载 模 块 的 相关 信息 。 另 外 ,可 以 使 用 sys. builtin_module_names 查看 那些 编译 进 
Python 解释 器 的 模块 名 字 ,这 些 模块 具有 最 快 的 访问 速度 和 最 高 的 执行 效率 。 

当 以 模块 形式 导入 . py 或 . pyw 源 文件 时 ,系统 会 自动 检查 __pycache_ 文件 夹 中 是 否 
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存在 相应 的 . pye 文件 ,如 果 有 且 签 名 一 致 则 自动 从 . pyc 文件 导入 以 提高 加 载 速度 ,如 果 
源 文件 具有 比 . pyc 文件 更 新 的 签名 ,那么 导入 时 会 自动 重新 生成 . pyc 文件 。 但 需 注 意 的 
是 ,如 果 源 文件 不 存在 ,导入 时 不 会 检查 __pycache” 文件 夹 。 因 此 ,如 果 想 实现 无 源码 部 
署 ,应 该 把 所 有 . pye 文件 放 到 源 文件 的 文件 夹 中 而 不 是 _pycache_ 文件 夹 中 。 


171 inpart 模块 名 [as 别名 ] 

使 用 这 种 方式 导入 以 后 ,使 用 时 需要 在 对 象 之 前 加 上 模块 名 作为 前 级 ,必须 以 “模块 
名 .对象 名 "的 形式 进行 访问 。 如 果 模 块 名 字 很 长 的 话 ,可 以 为 导入 的 模块 设置 一 个 别 
名 ,然后 使 用 “别名 . 对 象 名 "的 方式 来 使 用 其 中 的 对 象 。 


>>>import math 本: 人 标准 库 rath 

>>>math.sin0.5) 不 0.5 单 位 是 弧度 ) 的 正弦 
0.479425538604203 

>>>import randam 枉 : 人 标准 库 random 

>>>n =randam.rancoam() 雁 得 [0,1) 内 的 随机 小 数 

>>>n =random.randint (1,100) 页 得 ,100] 区 间 上 的 随机 整数 
>>>n =randam. randrange (1,100) 娠 回 呈 ,100) 区 间 中 的 随机 整数 
>>>import os.path as path 本 入 标准 库 cs.path, 并 设置 别名 为 path 
>>>path.isfile(r'C: \Windows \notepad.exe') 

True 

>>>import numpy as mp 本 入 扩展 库 mmpy, 并 设置 别名 为 mp 
>>>a rp-array ((,2,3,4)) 妈 过 模块 的 别名 来 访问 其 中 的 对 象 
>>>a 

array ([1,2,3,4]) 

>>>print (a) 

[D234] 


172 from 模 块 名 import 对 象 名 [as 别名 ] 

使 用 这 种 方式 仅 导入 明确 指定 的 对 象 ,并 且 可 以 为 导入 的 对 象 确定 一 个 别名 。 这 种 
导入 方式 可 以 减少 查询 次 数 ,提高 访问 速度 ,同时 也 可 以 减少 程序 员 需 要 输入 的 代码 量 ， 
不 需要 使 用 模块 名 作为 前 组 。 


>>>fram math inport sin 可 导入 模块 中 的 指定 对 象 
>>>sin(3) 

0.1411200080598672 

>>>fram math inport sin as f 瞪 导 入 的 对 象 起 个 别名 
>>>£f 3) 


0.1411200080598672 
>>>framn cs-Fath jnport isfile 
>>>isfile (r'C: wincbws \notepad.ee') 
Tm 
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173 from 模块 名 inpat * 


这 是 上 面 用 法 的 一 种 极端 情况 ,可 以 一 次 导入 模块 中 通过 __all__ 变 量 指定 的 所 有 
对 象 。 


>>>fram math import * 本 和 人 标准 库 math 中 所 有 对 象 
>>>goaG6,18) 报 大 公约 数 

18 

>>>pi 棚 数 并 
3.141592653589793 

>>>e 迪 数 e 
2.718281828459045 

>>>10g (8) 峙 算 以 2 为 底 的 对 数值 
3.0 

>>>lcgl0 (100) 寻 算 以 10 为 底 的 对 数值 
2.0 

>>>radians (180) 把 角度 转换 为 弧度 


3.141592653589793 

这 种 方式 简单 粗暴 , 写 起 来 也 比较 省 事 , 可 以 直接 使 用 模块 中 的 所 有 对 象 而 不 需要 再 
使 用 模块 名 作为 前 级 。 但 一 般 并 不 推荐 这 样 使 用 。 一 方面 这 样 会 降低 代码 的 可 读 性 ,有 
时 候 很 难 区 分 自 定义 函数 和 从 模块 中 导入 的 函数 ; 另 一 方面 ,这 种 导入 对 象 的 方式 将 会 导 
致命 名 空间 的 混乱 。 如 果 多 个 模块 中 有 同名 的 对 象 , 只 有 最 后 一 个 导入 的 模块 中 的 对 象 
是 有 效 的 ,而 之 前 导入 的 模块 中 的 同名 对 象 都 将 无 法 访问 ,不 利于 代码 的 理解 和 维护 。 例 
如 ,a. py 文件 中 内 容 如 下 : 

GEf test(): 

Erint (rtest in a.py') 
b. py 文件 中 内 容 如 下 : 


aef test0 : 
print ('test in b.py') 
导入 a 模块 以 后 ,test( ) 方 法 是 可 用 的 ,而 导入 b 模块 之 后 a 模块 中 的 test( ) 方 法 就 
无 法 使 用 了 。 例 如 : 


>>>fram a inport * 

>>>test () 

test ina.py 

>>>fram b import * 数 会 导致 a 模块 中 的 test 0 函数 无 法 使 用 
>>>test () 

test inb.py 





10 Sr Python 程序 设计 开发 宝典 
. 


174 模块 导入 时 的 搜索 路 径 


不 管 以 哪 种 形式 导入 模块 并 使 用 其 中 的 对 象 ,Python 首先 在 当前 目录 中 查找 模块 文 
件 ,如 果 没 有 找到 则 从 sys 模块 的 path 变量 所 指定 的 目录 中 查找 ,如 果 仍 没有 找到 则 抛 出 
异常 提示 模块 不 存在 。 可 以 查看 sys 模块 中 path 变量 的 值 来 获知 Python 导入 模块 时 搜索 
模块 的 路 径 , 也 可 以 使 用 append( ) 方 法 向 其 中 添加 自 定义 的 文件 夹 以 扩展 搜索 路 径 。 另 
外 ,在 导入 模块 时 ,会 优先 导入 相应 的 . pyc 文件 (. py 或 . pyw 为 编译 后 生成 的 字 节 码 文 
件 ) ,如 果 相 应 的 . pyc 文件 与 . py 文件 时 间 不 相符 或 不 存在 对 应 的 . pyc 文件 , 则 导入 . py 
文件 ,同时 生成 . pye 文件 。 

Python 还 支持 从 zip 文件 中 导入 模块 。 假 设 当 前 文件 夹 中 有 个 内 含 Vector3. py 文件 
的 testZip. zip 文件 ,首先 导入 sys 模块 ,然后 执行 sys. path. append (testZip. zip') ,然后 即 可 
导入 Vector3. py 文件 作为 模块 来 使 用 。 


>>>wector3.。 file 得 看 已 导入 模块 对 应 的 程序 文件 


最 后 ,按照 Python 编码 规范 ,一 般 建议 每 个 import 语句 只 导入 一 个 模块 ,并 且 要 按照 
标准 库 .扩展 库 、 自 定义 库 的 顺序 进行 导入 。 


1.8 编写 与 发 布 自己 的 包 


除了 可 以 在 开发 环境 中 或 命令 提示 符 环境 中 直接 运行 ,任何 Python 程序 文件 都 可 以 
作为 模块 导入 并 使 用 其 中 的 对 象 ,这 也 是 实现 代码 复 用 的 重要 形式 。 通 过 Python 程序 的 
name__ 属 性 可 以 识别 程序 的 使 用 方式 , 每 个 Python 脚本 在 运行 时 都 会 有 一 个 
__name_ 属性 ,如 果 脚 本 作为 模块 被 导入 , 则 其 _name__ 属 性 的 值 被 自动 设置 为 模块 名 ; 
如 果 脚 本 作为 程序 直接 运行 , 则 其 _name_ 属性 值 被 自动 设置 为 字符 串 "__main__"。 例 
如 ,假设 程序 hello. py 中 的 代码 如 下 : 


def rain() : ef 是 用 来 定义 函数 的 Pythcn 关键 字 
if_ nae ==' rain _': 持 择 结构 ,识别 当前 的 运行 方式 
Print ("This program is rn directly.') 
elif nme _=='hello': 显 号 换行、 缩 进 表示 一 个 语句 块 的 开始 


print (This Program is used as a module.') 
main() 匀 用 上 面 定义 的 函数 
那么 通过 任何 方式 直接 运行 该 程序 时 都 会 得 到 下 面 的 结果 : 


This program is rn directly- 
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而 在 使 用 import hello 导入 该 模块 时 ,得 到 结果 如 下 : 
This program is used as a module. 


很 明显 ,对 于 大 型 软件 的 开发 ,不 可 能 把 所 有 代码 都 存放 到 一 个 文件 中 ,那样 会 使 得 
代码 很 难 维护 。 对 于 大 型 软件 系统 ,可 以 使 用 包 来 管理 多 个 模块 。 包 是 Python 用 来 组 织 
命名 空间 的 重要 方式 ,可 以 看 作 是 包含 大 量 Python 程序 模块 的 文件 夹 。 在 包 的 每 个 子 文 
件 夹 中 都 必须 包含 一 个 _init__. py 文件 ,该 文件 可 以 是 一 个 空 文件 , 仅 用 于 表示 当前 文 
件 夹 是 一 个 包 。__init__. py 文件 的 主要 用 途 是 设置 _all__ 变 量 以 及 执行 初始 化 包 所 需 
的 代码 ,其 中 _all_ 变量 中 定义 的 对 象 可 以 在 使 用 “from…import * "时 全 部 被 正确 导入 。 

假设 有 如 下 结构 的 包 : 


sory Top -level padece 
__int .py Initialize the sond package 
fomrats/ Sipackage for file fomrat corversicns 
一 -init _.py 


effects/ SuibpackacP for sound effects 


filters/ Sipadage for filters 


那么 ,可 以 在 自己 的 程序 中 使 用 下 面 的 代码 导入 其 中 一 个 模块 : 

然后 使 用 完整 路 径 来 访问 其 中 的 对 象 ,例如 : 
sound.effects.echo.echofilter (input, outpt, delay -0.7,atten =4) 

如 果 sound \effects\__init__. py 文件 中 有 下 面 一 行 的 代码 : 

__all =['echo' 'suarrouna' ‘reverse'] 

那么 就 可 以 使 用 下 面 的 方式 来 导入 _all 变量 指 定 的 echo .surround 和 reverse 对 象 : 
fram sound.effects inport * 

然后 使 用 下 面 的 方式 来 使 用 其 中 的 成 员 : 


echpechofilter (input, output, delay -0.7,atten 4) 
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在 组 织 自己 的 包 时 ,应 避免 只 有 一 个 __init__. py 的 文件 夹 。 例 如 , 如果 可 以 用 
common. py 实现 同样 的 功能 ,就 不 要 使 用 common\__init__. py 这 样 的 结构 ,除非 common. 
py 需要 实现 的 功能 非常 多 ,需要 分 散 到 多 个 库 中 ,例如 common\database. py .common\net. 
py .common\user. py 等 ,然后 再 在 common\、_init__. py 中 通过 _all 变量 指定 哪些 对 象 可 
以 导入 。 

在 自己 编写 模块 时 ,可 能 需要 反复 修改 代码 然后 重新 导入 模块 进行 测试 ,此 时 可 以 使 
用 imp 模块 或 importlib 模块 的 reload( ) 函数 。 重 新 加 载 模块 时 要 求 该 模块 已 经 被 正确 加 
载 过 ,也 就 是 说 ,第 一 次 导入 和 加 载 模块 时 不 能 使 用 reload( ) 方 法 。 

本 节 的 最 后 介绍 如 何 把 自己 的 Python 包 发 布 到 pypi, 假设 有 Python 程序 文件 
fastcopytree. py ,现在 编写 一 个 对 应 的 setup. py 文件 ,内 容 如 下 : 





setip ame ='fastoqpytreevvversicn ="1.0.0',py modules =['fastoopytree']， 

author ="'dong fuguovauthor erail =-'aongfuogac20058@126-com'v 

Url ='"httbp://user.qPzone.aH.com/306467355/27) 

然后 在 命令 提示 符 环 境 中 执行 python setup. py register 并 选择 1 进行 登录 ,如 果 没 有 

pypi 账号 可 以 选 2 先进 行 注 册 , 登 录 后 再 使 用 python setup. py register -n 检查 包 名 是 否 可 
用 ,最 后 使 用 python setup. py sdist upload 命令 把 自己 的 包 发 布 到 pypi 上 去 ,别人 就 可 以 
使 用 pip install fastcopytree 来 安装 这 个 包 了 。 当 然 , 上 面 的 setup. py 程序 还 有 更 多 的 参数 
可 以 使 用 ,例如 ,使 用 python setup. py bdist_wininst 可 以 创建 Windows 安装 包 。 


1.9 ”Python 程序 伪 编 译 与 打包 


众所周知 ,Python 是 纯粹 的 自由 软件 , 源 代码 和 解释 器 CPython 遵循 GPL( GNU 
General Public License ) 协议 。 那 么 很 自然 会 有 人 有 这 样 的 疑问 : 难道 Python 程序 只 能 以 
源 代码 的 方式 来 运行 吗 ? 能 不 能 通过 某 种 方式 来 保护 自己 的 源 代 码 呢 ? 答案 是 肯定 的 。 
这 方面 的 技术 主要 有 两 种 : 一 种 方法 是 把 Python 程序 伪 编 译 成 扩展 名 为 pye 的 字 节 码 文 
件 ; 一 种 是 通过 py2exe .pyinstaller 或 者 cx_Freeze 对 Python 程序 进行 打包 成 为 不 同 平台 上 
的 二 进 制 可 执行 文件 。 


1. Python 程序 伪 编译 


可 以 使 用 py_compile 模块 的 compile( ) 函数 或 compileall 模块 的 compile_file( ) 函数 
对 Python 源 程序 文件 进行 伪 编 译 得 到 扩展 名 为 pye 的 字 节 码 以 提高 加 载 和 运行 速度 , 同 
时 还 可 以 隐藏 源 代 码 。 假 设 有 Python 程序 Stack. py 文件 ,并 已 导入 py_compile 和 
compileall 模块 ,那么 常用 的 编译 方法 如 下 。 

1) py_compile. compile( 'Stack. py) 

等 价 于 compileall. compile_file('Stack. py') ,也 等 价 于 在 命令 提示 符 环境 中 执行 命令 
python -m py_compile Stack. py, 都 会 在 __pycache__ 文 件 夹 中 生成 文件 Stack. cpython- 
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35. pyc。 

2) py_compile. compile( 'Stack. py', optimize =1) 

等 价 于 compileall. compile_file( 'Stack. py'，optimize = 1) ,也 等 价 于 在 命令 提示 符 环境 
中 执行 命令 python -0 -m py_compile Stack. py, 属 于 优化 编译 ,会 在 __pycache__ 文 件 夹 中 
生成 Stack. cpython-35. opt-1. pyc 文件 。 

BN i pln 

等 价 于 compileall. compile_file( 'Stack. py', optimize =2) ,也 等 价 于 在 命令 提示 符 环境 
中 执行 命令 python -00 -m py_compile Stack. py ,属于 高 级 优化 编译 ,会 在 _pycache_ 文件 夹 
中 生成 文件 Stack. cpython-35. opt-2. pyc。 

此 外 ,Python 的 compileall 模块 还 提供 了 compile_dir( ) 和 compile_path( ) 等 方法 ,用 
来 支持 Python 源 程 序 文件 的 批量 编译 。 

那么 问题 来 了 ,是 不 是 编译 成 . pye 文件 以 后 真 的 无 法 查看 源 代码 呢 ? 实际 上 ,还 是 
有 很 多 办 法 可 以 查看 的 。 例 如 ,可 以 使 用 Python 扩展 库 uncompyle6 或 其 他 类 似 模块 来 完 
成 这 个 功能 。 使 用 pip 工具 安装 uncompyle6 之 后 ,可 以 使 用 下 面 的 代码 对 上 面 生 成 的 . 
pyc 文件 进行 反 编译 得 到 源 代码 : 

ronpyle6.nonpyle file(' _FPycache _\\Stack.qythan -35.gpt 1.pyce', 

Pan('_ _Pycache _\\Stack.py', 'w')) 

另外 ,http://tool. lu/pye/ 这 个 网 站 可 以 在 线 上 传 一 个 . pye 文件 ,然后 可 以 得 到 
Python 源 代码 (个 别 地 方 可 能 不 是 非常 准确 ,需要 自己 稍 做 调整 ), 并 且 还 提供 了 一 定 的 
代码 美化 功能 ,能 够 自动 处 理 代码 布局 和 排版 规范 。 


2. Python 程序 打包 


保护 源 代码 的 更 好 方式 是 把 Python 程序 转换 为 二 进 制 可 执行 程序 之 后 再 发 布 ,这 样 
还 使 得 打包 后 的 程序 可 以 在 没有 安装 Python 环境 和 相应 扩展 库 的 系统 中 运行 , 极 大 地 方 
便 了 用 户 。 可 以 把 Python 程序 打包 为 可 执行 程序 的 工具 有 py2exe( 仅 适用 于 Windows 平 
台 ) .pyinstaller .cx_Freeze 等 。 当 然 ,打包 之 前 首先 应 该 保证 Python 程序 可 以 正常 运行 ， 
并 且 本 机 已 安装 了 所 有 需要 的 扩展 模块 和 相关 的 动态 链接 库 文件 。 

以 使 用 py2exe 在 Windows 平台 上 打包 Python 程序 为 例 ,假设 有 Python 源 程序 文件 
test. py ,然后 编写 setup. py 文件 ,内 容 为 

jnmport PY2exe 

distbutils.core.setop (omsole=["'test.py"]) 

然后 在 命令 提示 符 下 执行 下 面 的 命令 : 

Pythan setup-py FEY2exe 

接 下 来 就 会 看 到 控制 台 窗 口中 大 量 的 提示 内 容 飞 快 地 闪 过 ,这 个 过 程 会 自动 搜集 
test. py 程序 执行 所 依赖 的 所 有 支持 文件 ,如 果 创 建成 功 的 话 则 会 在 当前 文件 夹 下 生成 一 
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个 dist 子 文件 夹 ,其 中 包含 了 最 终 程序 执行 所 需要 的 所 有 内 容 。 等 待 编译 完成 以 后 ,将 
dist 文件 中 的 文件 打包 发 布 即 可 。 当 然 ,对 于 简单 的 Python 程序 ,直接 在 命令 提示 符 环境 
执行 build_exe test. py 就 可 以 生成 . exe 可 执行 文件 了 。 

对 于 控制 台 应 用 程序 ,要 想 转换 为 exe 可 执行 程序 直接 套用 上 面 的 代码 框架 即 可 ,只 
需要 把 


distutils.core.setip (omnsole=["test.py']) 


这 行 代 码 中 的 文件 名 替换 为 自己 的 Python 程序 文件 名 即 可 。 对 于 GUI 应 用 程序 ,还 需要 
将 上 面 代码 中 的 关键 字 console 修改 为 windows。 

另外 一 个 比较 好 用 的 Python 程序 打包 工具 是 pyinstaller, 同 时 适用 于 Windows 平台 和 
Linux 平台 上 Python 程序 的 打包 ,使 用 pip 工具 安装 之 后 在 命令 提示 符 环境 中 使 用 命令 
pyinstaller -F -w kousuan. pyw 或 者 python pyinstaller-script. py -F -w kousuan. pyw 即 可 将 
Python 程序 kousuan. pyw 及 其 所 有 依赖 包 打包 成 为 当前 所 用 平台 上 的 可 执行 文件 。 

如 果 使 用 cx_Freeze 工具 的 话 ,假设 有 Python 程序 hello. py ,在 命令 提示 符 环境 执行 
Python cxfreeze hello. py 即 可 快速 创建 可 执行 程序 并 自动 搜集 依赖 的 包 。 除 此 之 外 ,在 
Windows 平台 上 cx_Freeze 还 支持 制作 . msi 安装 程序 。 


1.10 从 命令 行 参数 和 配置 文件 获取 信息 


实际 开发 中 ,很 多 时 候 需 要 从 外 部 获取 数据 ,根据 用 户 的 输入 或 配置 信息 来 决定 下 一 
步 应 采取 的 行为 。 除 了 使 用 内 置 函 数 input( ) 或 者 GUI 库 的 控件 和 对 话 框 来 接收 用 户 输 
入 以 外 ,还 可 以 使 用 sys 和 argparse 模块 来 接收 命令 行 参数 ,使 用 configparser 模块 从 外 部 
配置 文件 中 获取 信息 。 

sys 模块 的 argv 是 一 个 包含 若干 字符 串 的 列表 .用 来 接收 命令 行 参 数 , 其 中 第 一 个 元 
素 argv[0] 是 程序 本 身 的 名 字 , 后 面 其 他 元 素 是 用 户 输入 的 其 他 参数 。 在 输入 时 ,多 个 命 
令 行 参 数 之 间 使 用 空格 分 隔 。 使 用 argparse 模块 接收 并 解析 命令 行 参 数 的 内 容 请 参考 第 
12 章 使 用 多 线程 批量 复制 文件 的 示例 代码 。 

如 果 某 个 程序 需要 配置 大 量 信息 ,那么 可 以 把 与 程序 有 关 的 这 些 信息 单独 存放 到 一 
个 配置 文件 中 ,这 样 就 不 用 重复 输入 了 ,并 且 可 以 在 不 修改 代码 的 前 提 下 改变 代码 的 行 
为 ,只 需要 提供 不 同 的 配置 文件 即 可 。configparser 模块 提供 了 非常 方便 的 配置 文件 读 取 
接口 ,假设 配置 文件 test. ini 的 内 容 如 下 : 


[CEEAULT] 

GEfeultl -0 

defait2 导 

Cefault3 =% (nane)s,s (age)s,s (sex)s 
Terme -defant 

age 48 

sexM 
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[SacTTCNL] 
Penme =ong 
age 39 
sexM 


actir =yantai 


[SacTTCNP] 

reme =zharg 

age 0 

Sex 

weight =50 

那么 可 以 通过 下 面 的 代码 来 读 取 和 显示 配置 文件 中 的 信息 : 
inport ccnfigparser 


conf =confioparser.ConfigParser () 

onf.read('test.ini') 

Print (conf.geE ('SECTTCNL' 'age')) 

Print (conf.geE ("SECTTONP' 'sex')) 

粳 用 sacrTcNL 节 中 的 信息 替换 rEEsorT 节 中 的 defaut3 变量 
Print (onf.get ('SacTICNL 'default3")) 

print (onf.get ('sgcTIQD', 'default3")) 

Print (onf .get ("TEEADLT', "default3')) 
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2.1 


达 式 与 内 置 对 象 


Python 常用 内 置 对 象 


对 象 是 Python 中 最 基本 的 概念 之 一 ,在 Python 中 一 切 都 是 对 象 ,除了 整数 .实数 、 复 
数 .字符 串 .列表 元 组 .字典 .集合 ,还 有 zip .map .enumerate \filter 等 对 象 , 困 数 和 类 也 是 
对 象 。 常 用 的 Python 内 置 对 象 如 表 2-1 所 示 。 


表 2-1 Python 内 置 对 象 









































对 象 类 型 类 型 名 称 示 例 简要 说 明 
数字 int ,float , 1234.3.14，1.3e5. 3 + 和 数字 大 小 没有 限制 ,内 党 支持 复数 及 其 
complex 运算 
,wa 1m student" | 使 用 单 引号 \ 双 引号 三 引号 作为 定 界 
字符 串 str python abi, bo 人 字母 r 或 Ra 引导 的 表示 原始 字 
本 以 字母 b 引导 ,可 以 使 用 单 引号 、 双 引 
字 节 串 bytes b'hello world 号 .三 引号 作为 定 界 符 
所 有 元 素 放 在 一 对 方 括号 中 ,元 素 之 间 
列表 list [1,2,3],[a', b', ['e', 2] ] | 使 用 逗号 分 隔 , 其 中 的 元 素 可 以 是 任意 
类 型 
字典 十 11: 'food ，, 2: 'taste '，3: | 所 有 元 素 放 在 一 对 大 括号 中 ,元 素 之 间 
sa 二 jimport'| 使 用 逗号 分 隔 , 元 素 形 式 为 " 键 : 值 " 
所 有 元 素 放 在 一 对 圆 括号 中 ,元 素 之 间 
元 组 tuple (2, -5,6), (3,) 使 用 逗号 分 隔 ,如 果 元 组 中 只 有 一 个 元 
素 的 话 . 后 面 的 逗号 不 能 省 略 
所 有 元 素 放 在 一 对 大 括号 中 ,元 素 之 间 
集合 set frozenset | |'a', b', ‘ce'| 使 用 逗号 分 隔 ,元 素 不 允许 重复 ;另外 ， 
set 是 可 变 的 ,而 frozenset 是 不 可 变 的 
逻辑 值 ,关系 运算 符 、 成 员 测 试 运算 符 、 
布尔 型 bool Tme, False 同一 性 测试 运算 符 组 成 的 表达 式 的 值 一 
般 为 Tme 或 False 
空 类 型 NoneType None 空 值 
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有 
续 表 
对 象 类 型 ”| 类 型 名 称 示 例 简要 说 明 
Exception 
异常 ValueError Python 内 置 大 量 异 常 类 ,分 别 对 应 不 同 
TypeError 类 型 的 异常 
加 国有 open 是 Python 的 内 贤 丽 数 ,使 用 指定 的 
> {open data dat， wh) | 模式 打开 文件 ,返回 文件 对 象 
生成 器 对 象 .range 对 象 .zip 
其 他 迁 代 对 象 对 象 、enumerate 对 象 .map | 具有 全 性 求 值 的 特点 
对 象 filter 对 象 等 
人 ee 类 和 函数 都 属于 可 调用 对 象 ,模块 用 来 
ee 集中 存放 函数 .类 .常量 或 其 他 对 象 
211 常量 与 变量 


在 表 2-1 中 ,第 3 列 的 示例 除了 最 后 4 行 之 外 ,其 他 都 是 合法 的 Python 常量 。 所 
谓 常量 ,一般 是 指 不 需要 改变 也 不 能 改变 的 字面 值 ,例如 一 个 数字 3, 又 例如 一 个 列表 
[1,2,3] ,都 是 常量 。 与 常量 相反 ,变量 的 值 是 可 以 变化 的 ,这 一 点 在 Python 中 更 是 体现 
得 淋 滴 尽 致 。 在 Python 中 ,不 需要 事先 声明 变量 名 及 其 类 型 ,直接 赋值 即 可 创建 任意 类 
型 的 对 象 变量 。 不 仅 变 量 的 值 是 可 以 变化 的 ,变量 的 类 型 也 是 随时 可 以 发 生 改 变 的 。 例 
如 ,下 面 第 一 条 语句 创建 了 整 型 变量 x ,并 赋值 为 3。 

>>>x 上 型 变量 

>>>type (2) 风 管 函数 type0 用 来 查看 变量 类 型 

<class 'int'> 

>>>type (x) ==int 

True 

>>>isinstance (x, int) 购 管 函数 isinstance 0 用 来 测试 变量 是 否 为 指定 类 型 

True 

下 面 的 语句 创建 了 字符 串 变量 x, 并 赋值 为 'Hello world. ', 之 前 的 整 型 变量 x 不 复 
存在 。 

>>>x='Hello world." 疗 符 串 变 量 

下 面 的 语句 创建 了 列表 对 象 x, 并 赋值 为 [1, 2, 3] ,之 前 的 字符 串 变量 x 也 就 不 再 存 
在 了 。 这 一 点 同样 适用 于 元 组 字典、 集合 和 其 他 Python 任意 类 型 的 对 象 ,包括 自 定义 类 
型 的 对 象 。 


>>>x=[1,2,3] 


Python 采用 基于 值 的 内 存 管 理 模式 。 赋 值 语句 的 执行 过 程 是 : 首先 把 等 号 右 侧 表 达 
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式 的 值 计 算出 来 ,然后 在 内 存 中 寻找 一 个 位 置 把 值 存放 进去 ,最 后 创建 变量 并 指向 这 个 内 
存 地 址 。Python 中 的 变量 并 不 直接 存储 值 ,而 是 存储 了 值 的 内 存 地 址 或 者 引用 ,这 也 是 变 
量 类 型 随时 可 以 改变 的 原因 。 

虽然 不 需要 在 使 用 之 前 显 式 地 声明 变量 及 其 类 型 ,但 Python 是 一 种 不 折 不 扣 的 强 类 
型 编程 语言 ,Python 解释 器 会 根据 赋值 运算 符 右 侧 表达 式 的 值 来 自动 推断 变量 类 型 。 其 
工作 方式 类 似 于 “状态 机 ” ,变量 被 创建 以 后 ,除非 显 式 修改 变量 类 型 或 删除 变量 ,否则 变 
量 将 一 直 保 持 之 前 的 类 型 。 

如 果 变 量 出 现在 赋值 运算 符 或 复合 赋值 运算 符 (例如 + =、* = 等 ) 的 左边 则 表示 创 
建 变 量 或 修改 变量 的 值 ,否则 表示 引用 该 变量 的 值 ,这 一 点 同样 适用 于 使 用 下 标 来 访问 列 
表 、 字 典 等 可 变 序列 以 及 自 定义 对 象 中 元 素 的 情况 。 例 如 : 


>>>x 3 创建 整 型 变量 

>>>print (x* 冯 ) 坊 问 变量 的 值 

9 

>>>x+=6 月 改变 量 的 值 
>>>x=[1,2,3] 得 | 建 列表 对 象 

>>>x[1] 起 月 改 列表 元 素 值 
>>>print (x) 答 出 显示 整个 列表 
[1,5,3] 

>>>print (x[2]) 答 出 显示 列表 指定 元 素 


3 

在 Python 中 定义 变量 名 的 时 候 , 需 要 注意 以 下 问题 。 

(1) 变量 名 必须 以 字母 或 下 画 线 开头 ,但 以 下 画 线 开头 的 变量 在 Python 中 有 特殊 含 
义 ,请 参考 第 6 章 内 容 。 

(2) 变量 名 中 不 能 有 空格 或 标点 符号 (括号 .引号 、 有 逗号 、 斜 线 、 反 斜 线 . 冒 号 、 句 号 、 
问号 等 ) 。 

(3) 不 能 使 用 关键 字 作 为 变量 名 ,Python 关键 字 的 介绍 请 见 2.3 节 。 要 注意 的 是 , 随 
着 Python 版 本 的 变化 ,关键 字 列 表 可 能 会 有 所 变化 。 

(4) 不 建议 使 用 系统 内 置 的 模块 名 类 型 名 或 函数 名 以 及 已 导入 的 模块 名 及 其 成 员 
名 作为 变量 名 ,这 会 改变 其 类 型 和 含义 ,甚至 会 导致 其 他 代码 无 法 正常 执行 。 可 以 通过 
dir( __builtins__) 查 看 所 有 内 置 对 象 名 称 。 

(5) 变量 名 对 英文 字母 的 大 小 写 敏 感 ,例如 student 和 Student 是 不 同 的 变量 。 


212 数字 


在 Python 中 ,内 置 的 数字 类 型 有 整数 .实数 和 复数 ,借助 于 标准 库 fractions 中 的 
Fraction 对 象 可 以 实现 分 数 及 其 运算 ,而 fractions 中 的 Decimal 类 则 实现 了 更 高 精度 的 


运算 。 
1. 内 置 的 整数 .实数 与 复数 
Python 支持 任意 大 的 数字 ,具体 可 以 大 到 什么 程度 仅 受 内 存 大 小 的 限制 。 由 于 精度 
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的 问题 ,对 于 实数 运算 可 能 会 有 一 定 的 误差 ,应 尽量 避免 在 实数 之 间 直 接 进 行 相等 性 测 
试 ,而 是 应 该 以 两 者 之 差 的 绝对 值 是 否 足 够 小 作为 两 个 实数 是 否 相 等 的 依据 。 在 数字 的 
算术 运算 表达 式 求 值 时 会 进行 隐 式 的 类 型 转换 ,如 果 存 在 复数 则 都 变 成 复数 ,如 果 没 有 复 
数 但 是 有 实数 就 都 变 成 实数 ,如 果 都 是 整数 则 不 进行 类 型 转换 。 
>>>9999 *#*99 蒂 里 * 赣 和 客 乘 运算 符 ,等 价 于 内 置 函 数 pow() 
9901483535267234876022631247532826255705595288957910573243265291217948378940535 
1346442217682691643393258692438667776624403200162375682140043297505120882020498 
0098735552703841362304669970510691243800218202840374329378800694920309791954185 
1177984343295912121591062986999386699080675733747243312089424255448939109100732 





>>>0.4 -0.1 禾 数 相 减 ,结果 稍微 有 点 偏差 
0.30000000000000004 

>>>0.4 -0.1=-0.3 科 尽 量 避 免 直 接 比较 两 个 实数 是 否 相 等 
False 

>>>abs (0.4 0.1 -0.3) <Le-6 佼 里 le -6 表示 10 的 -6 次 方 

True 

Python 内 置 支持 复数 类 型 及 其 运算 ,并 且 形 式 与 数学 上 的 复数 完全 一 致 。 例 如 : 
>>xx = 44 柄 用 j 或 了 表示 复数 虚 部 

>>>y 考 +46j 

>>>x+4y 坡 持 复数 之 间 的 加 , 减 乘 、 除 以 及 每 乘 等 运算 
(8 #10j) 

>>>x*y 

(3 +138j) 

>>>abs (x) 购 园 函数 acs0 可 用 来 计算 复数 的 模 
5.0 

>>>x.imag 看 部 

4.0 

>>>x.real 余部 

3.0 

>>>x.ccnjucate () 由 思 复数 

G-9) 


Python 3. 6. x 支持 在 数字 中 间 位 置 使 用 单个 下 画 线 作 为 分 隔 来 提高 数字 的 可 读 性 ， 
类 似 于 数学 上 使 用 逗号 作为 千 位 分 隔 符 。 在 Python 数字 中 单个 下 夯 线 可 以 出 现在 中 间 
任意 位 置 ,但 不 能 出 现在 开头 和 结尾 位 置 ,也 不 能 使 用 多 个 连续 的 下 面 线 。 

>>%1 000_000 

1000000 

>> 习 234 
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>> 忆 2 本 
0Q2 +34j) 
>> 习 2.3 45 

12.345 


2. 分 数 


Python 标准 库 fractions 中 的 Fraction 对 象 支持 分 数 运算 ,还 提供 了 用 于 计算 最 大 公约 
数 的 gcd( ) 函数 和 高 精度 实数 类 Decimal ,这 里 重点 介绍 Fraction 对 象 。 

>>>fran fracticns import Eracticn 

>>>x Fraction (3,5) 覃 建 分 数 对 象 

>>>y Fraction B,7) 

>>>x 

Eracticn (3,5) 

>>>x ** 2 媚 运 算 

Fraction (9,25) 

>>>x.numerator 性 看 分 于 

3 

>>>x.denaminator 得 看 分 母 

5 

>>>x+y 坡 持 分 数 之 间 的 四 则 运算 ,自动 进行 通 分 

Fractian (36,35) 

>>>x-y 

Fraction (6,35) 

>>>x* y 

Fraction (9,35) 

>>>x/y 

Eracticn (7,5) 

>>>x* 2 份 数 与 数字 之 间 的 运算 

Fraction (6,5) 

>>>Eracticn (3.5) 把 实数 转换 为 分 数 

Eracticn (7,2) 


3. 高 精度 实数 
标准 库 fractions 和 decimal 中 提供 的 Decimal 类 实现 了 更 高 精度 的 运算 。 


>>>fram fracticns import Deciral 


>> 习 /9 的 秆 的 实数 类 型 
0.1111111111111111 

>>>Decinel Q/9) 鸠 精度 实数 

Decimal ('0.111111111111111104943205418749130330979824066162109375') 
>>31/3 


0.3333333333333333 
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>>>Deciral (1/3) 

Decimal ('0.333333333333333314829616256247390992939472198486328125") 

>>>Decinal (1/9) +Deciral (1/3) 

Decimal ("0.44444444444444441977282167507) 

从 Python 3. 6. x 开始 ,Decimal 对 象 提供 了 一 个 新 的 方法 as_integer_ratio( ) ,可 以 把 实 
数 转换 成 两 个 整数 ,这 两 个 整数 的 商 恰好 等 于 该 实数 。 

>>>fram decimal import Deciral 

>>>Decirael (' -3.14') .as integer ratio() 

(57,50) 


213 字符 串 


在 Python 中 ,没有 字符 常量 和 变量 的 概念 ,只 有 字符 串 类 型 的 常量 和 变量 ,单个 字符 
也 是 字符 串 。 使 用 单 引 号 、. 双 引号 .三 单 引号 .三 双 引 号 作为 定 界 符 (delimiter) 来 表示 字 
符 串 , 并 且 不 同 的 定 界 符 之 间 可 以 互相 由 套 。Python 3. x 全 面 支持 中 文 , 中 文 和 英文 字母 
都 作为 一 个 字符 对 待 , 甚 至 可 以 使 用 中 文 作为 变量 名 。 除 了 支持 使 用 加 号 运算 符 连接 字 
符 串 以 外 ,Python 字符 串 还 提供 了 大 量 的 方法 支持 查找 替换、 排版 等 操作 。 很 多 内 置 函 
数 和 标准 库 对 象 也 支持 对 字符 串 的 操作 ,将 在 第 7 章 进行 详细 介绍 。 这 里 先 简 单 介绍 一 
下 字符 串 对 象 的 创建 和 连接 。 

>>>x ="'Hello world." 重用 单 引号 作为 定 界 符 

>>>x ="Pythan is a great language." 炖 用 双 引 号 作为 定 界 符 

>>>x="'""'Tam saig, "Tet's go 杯 同 定 界 符 之 间 可 以 互相 嵌 套 

>>>print (x) 

Tam said, "Tet's go." 

>>>x ='gpod ' +moming' 许 接 字符 串 

>>>x 

‘gpod moming' 

>>>x="'gpod 'moming" 姓 接 字符 串 , 仅 适用 于 字符 串 常量 

>>>x 

‘good moming' 

>>>x='gpod ' 

>>>x =x'moming' 环 适用 于 字符 串 变 量 

SyntaxError: irvalid syntax 

>>>x =x +'moming' 人 疗 符 串 变 量 之 间 的 连接 可 以 使 用 加 号 

>>>x 

"goodmoming' 

Python 3.x 除了 支持 Unicode 编码 的 str 类 型 字符 串 之 外 ,还 支持 字 节 串 类 型 bytes。 
对 str 类 型 的 字符 串 调用 其 encode( ) 方法 进行 编码 得 到 bytes 字 节 串 , 对 bytes 字 节 串 调 
用 其 decode( ) 方 法 并 指定 正确 的 编码 格式 则 得 到 str 字符 串 。 例 如 : 


>>>type ('Hello world') 上 协 认 字符 串 类 型 为 str 
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Cs str'> 


>>>type "Hello world') 三 定 界 符 前 加 上 字母 bp 表 示 字 节 串 

< class "bytes' > 

>>>'EEIlo world' .enoode ("utf -8') 桂 用 UF -8 编码 格式 进行 编码 

b'Hello world' 

>>>'HELo world' .encode ('gok') 竺 用 gx 编码 格式 进行 编码 

b'Hello world' 

>>>' 董 付 国 ' .encode (rutf -8') 娃 中 文 进 行 编码 

b' VE8 V91 VE3 VE4 VibV98 ve5 Yobvtha' 

>>> .Gecode(rutf -8") #- 个 下 夯 线 表示 最 后 一 次 正确 输出 结果 
' 董 付 国 ' 


>>>' 董 付 国 ' .encode ('gok') 
b' vb6 Vad VibB Vib6 Viog vefa' 

>>> .Gecode ('gok') 出 bytes 字 节 串 进行 解码 
' 董 付 国 ' 


214 列表 、 元 组 .字典 、 集 合 


列表 元 组 .字典 和 集合 是 Python 中 常用 的 序列 类 型 ,很 多 复杂 的 业务 逻辑 最 终 还 是 
由 这 些 基 本 数据 类 型 来 实现 。 表 2-2 比较 了 这 几 种 结构 的 区 别 。 


表 2-2 列表 、 元 组 字典、 集合 的 对 比 















































比较 项 列 表 元 组 字 典 集合 
类 型 名 称 list tuple dict set 
定 界 符 方 括号 [] 圆 括号 () 大 括号 1 大 括号 | |} 
是 否 可 变 是 否 是 是 
是 否 有 序 是 是 否 埋 
we 是 (使 用 序号 作为 | 是 (使 用 序号 作为 下 | 是 (使 用 * 键 " 作为 
i 下 标 ) 标 ) 下 标 ) 要 
元 素 分 隔 符 逗号 逗号 逗号 逗号 
对 元 素 形式 的 要 求 无 无 键 : 值 必须 可 哈 希 
对 元 素 值 的 要 求 无 无 “ 键 " 必须 可 哈 希 必须 可 哈 希 
ee “ 键 "不 允许 重复 ， 
元 素 是 否 可 重复 。 | 是 是 pd 志 
元 素 查 找 速度 非常 慢 很 慢 非常 快 非常 快 
, 尾部 操作 快 ,其 他 
新 增 和 删除 元 素 速 度 位 置 慢 不 允许 快 快 





下 面 的 代码 简单 演示 了 这 几 种 对 象 的 创建 与 使 用 ,更 详细 的 介绍 请 参考 第 3 章 。 


>>x list =[1,2,3] 利 建 列表 对 和 象 
>>>x tuple=(1,2,3) 利 建 元 组 对 象 
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>>>x dict ={"'a':97, 'b':98, 'c':99} 帘 | 建 字典 对 象 

>>>x_set ={1,2,3} 利 建 集合 对 和 象 

>>>print (x 1ist[1]) 三 用 下 标 访问 指定 位 置 的 元 素 
>>>Erint 区 tple[l]) 冉 组 也 支持 使 用 序号 作为 下 标 
六 

>>>print (x dict['a']) 疗 典 对 象 的 下 标 是 “ 键 ” 

9 

>>>3 in x set 故 员 测试 

True 


除了 这 几 种 结构 之 外 ,前 面 介 绍 的 字符 串 也 具有 相似 的 操作 , 详 见 第 7 章 。 另 外 ， 
Python 还 提供 了 range .map .zip \filter ,enumerate ,reversed 等 大 量 迭 代 对 象 (迭代 对 象 可 以 
理解 为 表示 数据 流 的 对 象 ,每 次 返回 一 个 数据 ) 。 这 些 迭 代 对 象 大 多 具有 与 Python 序列 
相似 的 操作 方法 ,比较 大 的 区 别 在 于 这 些 迭 代 对 象 大 多 具有 惰性 求 值 的 特点 , 仅 在 需要 时 
才 给 出 新 的 元 素 ,减少 了 对 内 存 的 占用 , 详 见 2.4 节 。 


2.2 ”Python 运算 符 与 表达 式 


Python 是 面向 对 象 的 编程 语言 ,在 Python 中 一 切 都 是 对 象 。 对 象 由 数据 和 行为 两 部 
分 组 成 ,而 行为 主要 通过 方法 来 实现 ,通过 一 些 特殊 方法 的 重 写 ,可 以 实现 运算 符 重 载 。 
运算 符 也 是 表现 对 象 行为 的 一 种 形式 ,不 同类 的 对 象 支持 的 运算 符 有 所 不 同 ,同一 种 运算 
符 作 用 于 不 同 的 对 象 时 也 可 能 会 表现 出 不 同 的 行为 ,这 正 是 “多 态 " 的 体现 。 

在 Python 中 ,单个 常量 或 变量 可 以 看 作 最 简单 的 表达 式 , 使 用 除 赋 值 运算 符 之 外 的 
其 他 任意 运算 符 和 函数 调用 连接 的 式 子 也 属于 表达 式 。 

除了 算术 运算 符 .关系 运算 符 .逻辑 运算 符 以 及 位 运算 符 等 常见 运算 符 之 外 ,Python 
还 支持 一 些 特有 的 运算 符 , 例 如 成 员 测 试 运算 符 、 集 合 运算 符 、 同 一 性 测试 运算 符 等 。 使 
用 时 需 注意 ,Python 很 多 运算 符 具 有 多 种 不 同 的 含义 ,作用 于 不 同 对象 时 的 含义 并 不 完全 
相同 ,非常 灵活 。 常 用 的 Python 运算 符 如 表 2-3 所 示 ,运算 符 优 先 级 遵循 的 规则 为 : 算术 
运算 符 的 优先 级 最 高 ,其 次 是 位 运算 符 成员 测试 运算 符 .关系 运算 符 .逻辑 运算 符 等 , 算 
术 运 算 符 遵循 先 乘 除 ,后 加 减 "的 基本 运算 原则 。 虽 然 Python 运算 符 有 一 套 严格 的 优先 
级 规则 ,但 是 强烈 建议 在 编写 复杂 表达 式 时 使 用 圆 括号 说 明 其 中 的 逻辑 来 提高 代码 可 读 
性 。 记 住 , 圆 括号 是 明确 和 改变 表达 式 运算 顺序 的 利器 ,在 适当 的 位 置 使 用 括号 可 以 使 得 
表达 式 的 含义 更 加 明确 。 





表 2-3 ”Python 运算 符 
运 算 符 功能 说 明 
+ 算术 加 法 ,列表 ,元 组 ,字符 串 合并 与 连接 , 正 号 
一 算术 减法 ,集合 差 集 ,相反 数 
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续 表 
运 算 符 功能 说 明 
水 算术 乘法 ,序列 重复 
六 真 除 法 
we 求 整 商 ,但 如 果 操 作 数 中 有 实数 的 话 ,结果 为 实数 形式 的 整数 
% 求 余数 ,字符 串 格式 化 
i 睾 运 算 
<、 <=、>、>=、==\!= ( 值 ) 大 小 比较 ,集合 的 包含 关系 比较 
or 逻辑 或 
and 逻辑 与 
mot 逻辑 非 
in 成 员 测 试 
is 对 象 同一 性 测试 , 即 测试 是 否 为 同一 个 对 象 或 内 存 地址 是 否 相 同 
JR 二 位 或 .位 异 或 .位 与 , 左 移 位 、 右 移 位 、 位 求 反 
i 集合 交集 .并 集 ,对称 差 集 
@ 和 矩阵 相 乘 运算 符 
221 算术 运算 符 


(1) + 运算 符 除 了 用 于 算术 加 法 以 外 ,还 可 以 用 于 列表 元 组 .字符 串 的 连接 ,但 不 支 
持 不 同类 型 的 对 象 之 间 相 加 或 连接 。 


>>>[1,2,3] +[4,5,6] 姓 接 两 个 列表 

[1,2,3,4,5,6] 

>>>(1,2,3) +(4,) 姐 接 两 个 元 组 

(1,2,3,4) 

>>>'abod' +"1234' 姓 接 两 个 字符 串 

"abcal234" 

>>>'' 世 环 支 持 字符 与 数字 相 加 , 抛 出 异常 
TypeError: Can't corvert ‘int' doject to str jimplicitly 

>>>Tre 3 fythcn 内 部 把 True 当 作 1 处 理 
4 

>>>Ealse 3 把 False 当 作 0 处 理 

3 


(2) * 运算 符 除 了 表示 算术 乘法 ,还 可 用 于 列表 .元 组 .字符 串 这 几 个 序列 类 型 与 整 
数 的 乘法 ,表示 序列 元 素 的 重复 ,生成 新 的 序列 对 象 。 字 典 和 集合 不 支持 与 整数 的 相 乘 ， 
因为 其 中 的 元 素 是 不 允许 重复 的 。 
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>>>True* 3 

和 3 

>>>False* 3 

0 

>>>[1,2,3] * 3 
Ly2, 3 2537l273) 
>>>(1,2,3) * 3 
(1,2,3,1,2,3,1,2,3) 
>>>'abc'* 3 
‘abcabcabe' 


(3) 运算 符 / 和 // 在 Python 中 分 别 表示 算术 除法 和 算术 求 整 商 ( floor division)。 


>>>3/2 散 学 意义 上 的 除法 

1.5 

>>>15 // 4 区 1 果 两 个 操作 数 都 是 整数 ,结果 为 整数 
3 


>>>5.0 // 4 车 果 操作 数 中 有 实数 ,结果 为 实数 形式 的 整数 值 
3.0 


>>> -15//4 向 下 取 整 

- 放 

(4) % 运 算 符 可 以 用 于 整数 或 实数 的 求 余数 运算 ,还 可 以 用 于 字符 串 格 式 化 ,但 是 并 
不 推荐 这 种 用 法 ,关于 字符 串 格式 化 的 详细 介绍 请 参考 第 7 章 。 


>>>789 $23 覆 数 
7 
>> 习 23.45 $3.2 何以 对 实数 进行 余数 运算 ,注意 精度 问题 
1.849999999999996 
>>>'% Cc,%d' gs (65,65) 把 画 分 别 格式 化 为 字符 和 整数 
wav65， 
>>>'% £,%5"' % (65,65) 由 5 分 别 格式 化 为 实数 和 字符 串 
"165.000000,65" 
(5) ** 汉 算 符 表示 竹 乘 ,等 价 于 内 置 函数 pow( ) 。 例 如 : 
>>>3 * 了 蜡 的 2 次 方 ,等 价 于 PowG,2) 
9 
>>>pow (3,2,8) 往 价 于 G* 吧 )%8 
>>>9 saD.5 曙 的 0.5 次 方 , 即 9 的 平方 根 
3.0 
>>>( -9) *aD.5 条 以 计算 负数 的 平方 根 
(1.8369701987210297e -16 +43j) 
222 关系 运算 符 


了 Python 关系 运算 符 最 大 的 特点 是 可 以 连用 ,其 含义 与 我 们 日 常 的 理解 完全 一 致 。 使 
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用 关系 运算 符 的 一 个 最 重要 的 前 提 是 ,操作 数 之 间 必 须 可 比较 大 小 。 例 如 ,把 一 个 字符 串 
和 一 个 数字 进行 大 小 比较 是 毫 无 意义 的 ,所 以 Python 也 不 支持 这 样 的 运算 。 


>> 忆 <<5 笠 价 于 1-< ama3<5 
True 

>>3 5 之 

True 

>> 忆 >6< 

False 

>> 习 >6 qath.sqpt (9) 很 有 惰性 求 值 或 者 迎 辑 短路 的 特点 
False 

>> 忆 <6<rath.scpt(9) 乒 没 有 导入 math 模块 , 抛 出 异常 
NEmsError: name "math' is not defined 

>>>import math 

>>> <6 arath.scrt(9) 

False 

>>>'Hello' >'world' 几 较 字符 串 的 大 小 
False 

>>>[1,2,3] <[1,2,4] 山 较 列表 的 大 小 
True 

>>>'Hello' 3 好 符 串 和 数字 不 能 比较 
TypeError: unorderable types: str() >int () 

>>>{1,2,3} <{1,2,3,4} 抽 试 是 否 子 集 
True 

>>>{1,2,3} =={3,2,1} 抽 试 两 个 集合 是 否 相 等 
True 

>>>{1,2,4} >{1,2,3} 集合 之 间 的 包含 测试 
False 

>>>{1,2,4} <{1,2,3} 

False 

>>>{1,2,4} =={1,2,3} 

False 


223 成 员 测试 运算 符 in 与 同一 性 测试 运算 符 is 
成 员 测试 运算 符 in 用 于 成 员 测试 , 即 测试 一 个 对 象 是 否 为 另 一 个 对 象 的 元 素 。 


>> 妆 in [1,2,3] 抽 试 3 是 否 存 在 于 列表 0,2,3] 中 

Eee 

>>>5 in range (1,10,1) kance () 是 用 来 生成 指定 范围 数字 的 内 置 函 数 
True 

>>>'abc' in "abodefg' 村 字符 串 测试 

True 


>>>for i in B,5,7): 御 环 ,成 员 遍 历 
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Erint (i,end=" \t') 
357 
同一 性 测试 运算 符 (identity comparison) is 用 来 测试 两 个 对 象 是 否 是 同一 个 ,如 果 是 
则 返回 True ,否则 返回 False。 如 果 两 个 对 象 是 同一 个 ,两 者 具有 相同 的 内 存 地 址 。 


>>2 is3 
True 

>>>x =[300, 300,300] 

>>>x[0] is x[1] 蕉 于 值 的 内 存 管理 ,同一 个 值 在 内 存 中 只 有 一 份 
True 

>>>x=[1,2,3] 

>>>y=[1,2,3] 

>>>x isy 姓 面 形式 创建 的 x 和 y 不 是 同一 个 列表 对 象 
False 

>>>x[0] is y[0] 

True 

>>>x.append (4) 环 影响 列表 y 的 值 

>>>x 

[1,2,3,4] 

>>>Y 

[1,2,3] 

>>>x=y 如 和 y 指 向 同一 个 对 象 

>>>x isy 

True 

>>>x.append(4) 出 x 进 行 操作 会 对 y 造 成 同样 的 影响 
>>>x 

[1,2,3,4] 

>>>y 

[1,2,3,4] 


224 位 运算 符 与 集合 运算 符 


位 运算 符 只 能 用 于 整数 ,其 内 部 执行 过 程 为 : 首先 将 整数 转换 为 二 进 制 数 ,然后 右 对 
齐 , 必 要 的 时 候 左 侧 补 0, 按 位 进行 运算 ,最 后 再 把 计算 结果 转换 为 十 进 制 数字 返回 。 位 
与 运算 规则 为 1&l =1、1&0 =0&l =0&0 =0, 位 或 运算 规则 为 111 =110 =011 =1.010 =0, 位 
异 或 运算 规则 为 1%1 =0^0 =0.1%0=011 =1。 另 外 , 左 移 位 时 右 侧 补 0 ,每 左 移 一 位 相当 于 乘 
以 2; 右 移 位 时 左 侧 补 0, 每 右 移 一 位 相当 于 整除 以 2。 


>>3<2 把 3 左 移 2 位 
辽 

>>>3 7 六 与 运算 

EE 


>>3 18 粒 或 运算 
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. 
11 
>>>3^5 柱 异 或 运算 
6 
集合 的 交集 ,并 集 .对 称 差 集 等 运算 借助 于 位 运算 符 来 实现 ,而 差 集 则 使 用 减 号 运算 
符 实现 (注意 ,并 集运 算 符 不 是 加 号 ) 。 


>>>{1,2,3} | {3,4,5} 群集 ,自动 去 除 重 复元 素 
{1,2,3,4,5} 
>>>{1,2,3} & {3,4,5} 交集 
{3} 
>>>{1,2,3} ^ {3,4,5} 寻 称 差 集 
{1,2,4,5} 
>>>{1,2,3} -{3,4,5} 影集 
{1,2} 
225 慢 辑 运算 符 


逻辑 运算 符 and ,or not 常用 来 连接 条 件 表达 式 构成 更 加 复杂 的 条 件 表达 式 , 并 且 
and 和 or 具有 惰性 求 值 或 逻辑 短路 的 特点 , 当 连 接 多 个 表达 式 时 只 计算 必须 要 计算 的 值 。 
例如 ,表达 式 expl and exp2 等 价 于 expl if not expl else exp2 ,而 表达 式 expl or exp2 则 等 
价 于 expl if expl else exp2。 在 编写 复杂 条 件 表达 式 时 充分 利用 这 个 特点 ,合理 安排 不 同 
条 件 的 先后 顺序 ,在 一 定 程度 上 可 以 提高 代码 的 运行 速度 。 另 外 要 注意 的 是 ,运算 符 and 
和 or 并 不 一 定 会 返回 True 或 False ,而 是 得 到 最 后 一 个 被 计算 的 表达 式 的 值 ,但 是 运算 符 
not 一 定 会 返回 True 或 False。 


>> 妆 汪 amda23 广 意 ,此 时 并 没有 定义 变量 a 

False 

>>35ora”3 蜡 汉 的 值 为 False, 所 以 需要 计算 后 面 的 表达 式 
NEmeError: nere 'a' is not defined 

>>>3 -<5 cr a 冯 蜡 < 的 值 为 True, 不 需要 计算 后 面 的 表达 式 
TD 

>>>3 amd5 最 后 一 个 计算 的 表达 式 的 值 作为 整个 表达 式 的 值 
5 

>>>3 ana5 总 

True 

>>>3 not in [1,2,3] 好 辑 非 运算 not 

False 

>>>3 is mot 5 ct 的 计算 结果 只 能 是 True 或 false 之 一 

True 

>>>not 3 

False 

>>>not 0 

True 
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226 千 阵 乘法 运算 符 @ 


从 Python 3.5 开始 增加 了 一 个 新 的 矩阵 相 乘 运算 符 @ ,不 过 由 于 Python 没有 内 置 的 
矩阵 类 型 ,所 以 该 运算 符 常 与 扩展 库 numpy 一 起 使 用 。 另 外 ,@ 符号 还 可 以 用 来 表示 修 
饰 器 的 用 法 , 详 见 5.1.2 节 。 


>>>import nnpy 
>>>x npy.nes G) 


如 mpy 是 用 于 科学 计算 的 python 扩展 库 
nes 0 函数 用 于 生成 全 1 和 矩阵 ,参数 表示 和 卸 阵 大 小 


>>>m=nupy-eye G) * 3 5E (0 函数 用 于 生成 单位 矩阵 
>>>m[0,2] 上 般 置 算 阵 指定 位 置 上 元 素 的 值 
>>>m[2,0] 了 
>>>x@m 和 矩阵 相 乘 
array([ 6., 3., 8.]) 
227 补充 说 明 
除了 表 2-3 中 列 出 的 运算 符 之 外 ,Python 还 有 赋值 运算 符 = 和 + =、- =、* =、 


/= =、**# =、|=、^= 等 大 量 复 合 赋值 运算 符 。 例 如 ,x + = 3 在 语法 上 等 价 (注意 ， 
在 功能 的 细节 上 可 能 会 稍 有 区 别 , 请 参考 3.1.4 节 ) 于 x=x+ 3, 其 他 复合 赋值 运算 符 与 
此 类 似 , 不 再 著述 。 


Python 不 支持 + + 和 - -运算 符 , 昌 然 在 形式 上 有 时 候 似乎 可 以 这 样 用 ,但 实际 上 是 


另外 的 含义 ,要 注意 和 其 他 语言 


>> 习 了 

>>>+ 性 征 正 得 正 

好 

>>>+(143) 本 + 攻 等 价 

季 

>>>i++ fythcn 不 支持 + + 运算 符 , 语 法 错误 


SyntaxError: irvalid syntax 


>>> 一 十 


和 柄 负 得 正 , 等 价 于 -(-) 
熔 价 于 -(-(-) 


fythcn 不 支持 - -运算 符 , 语 法 错误 


粹 价 于 3-(-5) 


短 价 于 3+(-5) 


SS 
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2.3 Python 关键 字 简 要 说 明 


Python 关键 字 只 允许 用 来 表达 特定 的 语义 ,不 允许 通过 任何 方式 改变 它们 的 含义 ,也 
不 能 用 来 作为 变量 名 、 函 数 名 或 类 名 等 标识 符 。 在 Python 开发 环境 中 导入 模块 keyword 
之 后 ,可 以 使 用 print( keyword. kwlist) 查看 所 有 关键 字 , 含 义 如 表 2-4 所 示 。 
表 2-4 Python 关键 字 含义 

关键 字 含 芝 

False 常量 ,逻辑 假 

None 常量 , 空 值 

Tme 常量 , 迎 辑 真 

and 迪 辑 与 运算 

as 在 import 或 except 语句 中 给 对 象 起 别名 

assert 断言 ,用 来 确认 某 个 条 件 必须 满足 ,可 用 来 帮助 调试 程序 

break 用 在 循环 中 ,提前 结束 break 所 在 层次 的 循环 

class 用 来 定义 类 

continue | 用 在 循环 中 ,提前 结束 本 次 循环 






































def 用 来 定义 函数 
del 用 来 删除 对 象 或 对 象 成 员 
elif 用 在 选择 结构 中 ,表示 else if 的 意思 





else 可 以 用 在 选择 结构 .循环 结构 和 异常 处 理 结构 中 
except “| 用 在 异常 处 理 结构 中 ,用 来 捕获 特定 类 型 的 异常 
finally 用 在 异常 处 理 结构 中 ,用 来 表示 不 论 是 否 发 生 异常 都 会 执行 的 代码 





























for 构造 for 循环 ,用 来 从 代 序列 或 可 选 代 对 象 中 的 所 有 元 素 

明确 指定 从 哪个 模块 中 导入 什么 对 象 ,例如 from math import sin; 还 可 以 与 yield 一 起 构成 
yield 表达 式 

global 定义 或 声明 全 局 变量 

证 用 在 选择 结构 中 

import ”| 用 来 导入 模块 或 模块 中 的 对 象 

in 成 员 测 试 

is 同一 性 测试 





lambda ”| 用 来 定义 lambda 表达 式 ,类 似 于 函数 
nonlocal | 用 来 声明 nonlocal 变量 
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续 表 
关键 字 含 党 
not 逻辑 非 运 算 
or 池 辑 或 运算 





pass 空 语句 ,执行 该 语句 时 什么 都 不 做 ,常用 作 占 位 符 





raise 用 来 显 式 抛 出 异常 





retum 在 函数 中 用 来 返回 值 ,如 果 没 有 指定 返回 值 , 表 示 返 回 空 值 None 











try 在 异常 处 理 结 构 中 用 来 限定 可 能 会 引发 异常 的 代码 块 
while 用 来 构造 while 循环 结构 ,只 要 条 件 表达 式 等 价 于 True 就 重复 执行 限定 的 代码 块 
with 上 下 文 管理 ,具有 自动 管理 资源 的 功能 








yield 在 生成 器 函数 中 用 来 返回 值 


2.4 Python 常用 内 置 函数 用 法 精 要 


内 置 函 数 (built-in functions,BIF) 是 Python 内 置 对 象 类 型 之 一 ,不 需要 额外 导入 任何 
模块 即 可 直接 使 用 ,这 些 内 置 对 象 都 封装 在 内 置 模块 __builtins__ 之 中 ,用 C 语言 实现 并 
且 进 行 了 大 量 优化 ,具有 非常 快 的 运行 速度 ,推荐 优先 使 用 。 使 用 内 置 函 数 dir( ) 可 以 查 
看 所 有 内 置 函数 和 内 置 对 象 : 


>>>dir( builtins ) 


使 用 help( 函数 名 ) 可 以 查看 某 个 苑 数 的 用 法 。 另 外 ,也 可 以 不 导入 模块 而 直接 使 用 
help( 模块 名 ) 查 看 该 模块 的 帮助 文档 ,例如 help('math') 。 常 用 的 内 置 函 数 及 其 功能 简要 
说 明 如 表 2-5 所 示 ,其 中 方 括号 内 的 参数 可 以 省 略 。 

表 2-5 Python 常用 内 置 函 数 








函 数 功能 简要 说 明 
abs(x) 返回 数字 x 的 绝对 值 或 复数 x 的 模 
如 果 可 和 迭 代 对 象 iterable 中 所 有 元 素 x 都 等 价 于 True, 也 就 是 对 于 所 有 元 
all( iterable) 素 x 都 有 bool(x) 等 于 Tme, 则 返回 True。 对 于 空 的 可 和 迭代 对 象 也 返 
回 True 





只 要 可 和 迭代 对 象 iterable 中 存在 元 素 x 使 得 bool(x) 为 Trme, 则 返回 Tme。 
对 于 空 的 可 选 代 对 象 ,返回 False 

把 对 象 转换 为 ASCII 码 表示 形式 ,必要 的 时 候 使 用 转 义 字符 来 表示 特定 
的 字符 

bin(x) 把 整数 x 转换 为 二 进 制 串 表示 形式 

bool(x) 返回 与 x 等 价 的 布尔 值 True 或 False 


any(iterable) 





ascii( obj) 
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本 原 
续 表 
函 数 功能 简要 说 明 
bytes(x) 生成 字 节 串 ,或 把 指定 对 象 x 转换 为 字 节 串 表 示 形 式 
cllabletay 测试 对 象 obj 是 否 可 调用 。 类 和 函数 是 可 调用 的 ,包含 _call_( ) 方 法 的 
类 的 对 象 也 是 可 调用 的 
compile( ) 用 于 把 Python 代码 编译 成 可 被 exec( ) 或 eval( ) 函数 执行 的 代码 对 象 





complex(real，[imag] ) 


返回 复数 





chr(x) 


返回 Unicode 编码 为 x 的 字符 





delattr( obj, name) 


删除 属性 ,等 价 于 del obj. name 





返回 指定 对 象 或 模块 obj 的 成 员 列 表 , 如 果 不 带 参数 则 返回 当前 作用 域内 

















dir( obj) 所 有 标识 符 

divmod (x, y) 返回 包含 整 商 和 余数 的 元 组 ( (x 一 x%y)/y, x%y) 

enumerate ( iterable [, | 返回 包含 元 素 形 式 为 (start, iterable[0]), (start + 1 iterable[ 1 ] ) ，( stanrt 
start ] ) +2，iterable[2] ) , … 的 迭代 器 对 象 ,start 表示 索引 的 起 始 值 

ea 《lobals [，| 计算 并 返回 字符 趾 * 中 表达 式 的 什 

ocals] ] ) 

exec(x) 执行 代码 或 代码 对 象 x 

exit( ) 退出 当前 解释 器 环境 





filter( func, seq) 


返回 filter 对 象 ,其 中 包含 序列 seq 中 使 得 单 参数 函数 func 返回 值 为 True 
的 那些 元 素 ,如 果 函 数 func 为 None 则 返回 包含 seq 中 等 价 于 True 的 元 素 
的 filter 对 象 





float( x) 


把 整数 或 字符 串 x 转换 为 浮 点 数 并 返回 





frozenset( [ x] ) 


创建 不 可 变 的 集合 对 象 





getattr ( obj, 
default] ) 


name [, 


获取 对 象 中 指定 属性 的 值 , 等 价 于 obj. name ,如 果 不 存在 指定 属性 则 返回 
default 的 值 ,如 果 要 访问 的 属性 不 存在 并 且 没 有 指定 default 则 抛 出 异常 





globals( ) 


返回 包含 当前 作用 域内 全 局 变量 及 其 值 的 字典 





hasattr( obj, name) 


测试 对 象 obj 是 否 具有 名 为 name 的 成 员 














hash( x) 返回 对 象 x 的 哈 希 值 ,如果 x 不 可 哈 希 则 抛 出 异常 
help( obj) 返回 对 象 obj 的 帮助 信息 

hex(x) 把 整数 x 转换 为 十 六 进 制 串 

id( obj) 返回 对 象 obj 的 标识 ( 内存 地 址 ) 





input([ 提示] ) 


显示 提示 ,接收 键盘 输入 的 内 容 , 返 回 字符 串 





int(x[ , d]) 


返回 实数 (float) 分数 ( Fraction ) 或 高 精度 实数 (Decimal) x 的 整数 部 分 ， 
或 把 d 进 制 的 字符 串 x 转换 为 十 进 制 并 返回 ,d 默认 为 十 进 制 





isinstance ( obj, class-or- 


type-or-tuple ) 





测试 对 象 obj 是 否 属于 指定 类 型 (如 果 有 多 个 类 型 的 话 需 要 放 到 元 组 中 ) 
的 实例 
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续 表 





函 数 


功能 简要 说 明 





issubclass (cls，class _or 
tuple) 


测试 类 cls 是 否 为 指定 类 型 的 子 类 ,用 法 与 isinstance( ) 函数 相似 








iter(…) 返回 指定 对 象 的 可 选 代 对 象 
返回 对 象 obj 包含 的 元 素 个 数 , 适 用 于 列表 、 元 组 、 集 合 . 字 典 .字符 串 以 及 
len( obj) range 对 象 ,不 适用 于 具有 惰性 求 值 特点 的 生成 器 对 象 和 map ,zip 等 多 代 


对 象 





list ([ x])、 set ([x])、 
tuple( [x]) .dict( [x]) 


把 对 象 x 转换 为 列表 、 集 合 、 元 组 或 字典 并 返回 ,或 生成 空 列表 、 空 集合 、 
空 元 组 , 空 字典 





locals( ) 


返回 包含 当前 作用 域内 局 部 变量 及 其 值 的 字典 





map( func , siterables) 


返回 包含 若干 函 数值 的 map 对 象 ,函数 func 的 参数 分 别 来 自 于 iterables 
指定 的 一 个 或 多 个 迭代 对 象 ， 





max(…) 、min(…) 


返回 多 个 值 中 或 者 包含 有 限 个 元 素 的 可 和 迭代 对 象 中 所 有 元 素 的 最 大 值 、 
最 小 值 ,要求 所 有 元 素 之 间 可 比较 大 小 ,允许 指定 排序 规则 ,参数 为 可 选 
代 对 象 时 还 允许 指定 默认 值 





next( iterator[ , default] ) 


返回 迭代 对 象 x 中 的 下 一 个 元 素 , 人 允许 指定 迭代 结束 之 后 继续 和 迭代 时 返 
回 的 默认 值 





oct(x) 


把 整数 x 转换 为 八进制 串 





open(fn[ ,mode]) 


以 指定 模式 mode 打开 文件 fn 并 返回 文件 对 象 





ord(x) 


返回 1 个 字符 x 的 Unicode 编码 





pow(x, y, z= None) 


返回 x 的 y 次 方 ,等 价 于 x*y 或 (x* 和 9) 9% z 





print( value，…，sep =" 
end ='\n', file 
stdout, flush = False) 





基本 输出 函数 ,默认 输出 到 屏幕 , 相 邻 数据 使 用 空格 分 隔 ,以 换行 符 结束 
所 有 数据 的 输出 





quit( ) 


退出 当前 解释 器 环境 





range ([ start,] end [， 


step] ) 


返回 range 对 象 ,其 中 包含 左 闭 右 开 区 间 [ start,end) 内 以 step 为 步 长 的 
整数 





reduce ( func ,sequence [ ， 
initial] ) 


将 双 参 数 的 函数 fune 以 选 代 的 方式 从 左 到 右 依次 应 用 至 序列 seq 中 每 个 
元 素 ,并 把 中 间 计 算 结 果 作 为 下 一 次 计算 的 操作 数 之 一 ,最 终 返 回 单个 值 
作为 结果 。 在 Python 2. x 中 该 函数 为 内 置 函 数 ,在 Python 3. x 中 需要 从 
functools 中 导入 reduce 函数 再 使 用 





返回 对 象 obj 的 规范 化 字符 串 表示 形式 ,对 于 大 多 数 对 和 象 有 eval ( repr 





rpr Co (obj)) = =obj 
返回 seq( 可 以 是 列表 元 组 .字符 串 .range 等 对 象 ) 中 所 有 元 素 逆序 后 的 
reversed( seq) 和 迭代 器 对 象 ,不 适用 于 具有 惰性 求 值 特 点 的 生成 器 对 象 和 map \zip 等 可 
选 代 对 象 





小 数位 数 ] ) 


round(x [ ， 


对 x 进行 四 舍 五 入 ,车 不 指定 小 数位 数 , 则 返回 整数 





sorted ( iterable, 


None, reverse = False) 


key = 





返回 排序 后 的 列表 ,其 中 iterable 表示 要 排序 的 序列 或 迭代 对 象 ,key 用 来 
指定 排序 规则 或 依据 ,reverse 用 来 指定 升序 或 降序 


好 
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续 表 





函 数 功能 简要 说 明 
str( obj) 把 对 象 obj 直接 转换 为 字符 串 
sum(x, start =0) 返回 序列 x 中 所 有 元 素 之 和 ,允许 指定 起 始 值 start ,返回 start + sum(x) 
type( obj) 返回 对 象 obj 的 类 型 


ip(seql [ ，sed2 [.…]]) | 返回 ip 对 象 , 其 中 元 素 为 (seq1[i] ,seq2[i] ,…) 形 式 的 元 组 ,最 终结 果 
ge 中 包含 的 元 素 个 数 取 决 于 所 有 参数 序列 或 可 迁 代 对 象 中 最 短 的 那个 




















内 置 函数 数量 众多 且 功 能 强大 ,很 难 一 下 子 全 部 解释 清楚 ,下 面 先 简单 介绍 其 中 一 部 
分 ,后 面 的 章节 中 将 根据 内 容 组 织 的 需要 逐步 展开 和 演示 更 多 函数 更 加 巧妙 的 用 法 。 遇 
到 不 熟悉 的 函数 可 以 通过 内 置 郊 数 help( ) 查看 使 用 帮助 。 另 外 ,在 编写 程序 时 应 优先 考 
虚 使 用 内 置 函 数 ,因为 内 置 函数 不 仅 成 熟 .稳定 ,而 且 速 度 相对 较 快 。 


241 类 型 转换 与 类 型 判断 
(1) 内 置 函 数 bin( ) .oct( ) .hex( ) 用 来 将 整数 转换 为 二 进 制 八进制 和 十 六 进 制 形 
式 ,这 3 个 函数 都 要 求 参 数 必须 为 整数 。 


>>>bin (555) 由 数字 转换 为 二 进 制 串 
"QP1000101011" 

>>>oct (555) 悉 换 为 八进制 串 
1001053" 

>>>hex (555) 艇 换 为 十 六 进 制品 
10;02b! 





内 置 函数 int( ) 用 来 将 其 他 形式 的 数字 转换 为 整数 ,参数 可 以 为 整数 .实数 .分数 
法 的 数字 字符 串 , 当 参 数 为 数字 字符 串 时 ,还 允许 指定 第 二 个 参数 base 用 来 说 明 数 字 字 
符 串 的 进 制 。 其 中 ,base 的 取 值 应 为 0 或 2~36 之 间 的 整数 ,其 中 0 表示 按 数字 字符 串 隐 
含 的 进 制 进行 转换 。 

>>>int(-3.2) 把 实数 转换 为 整数 

坊 

>>>from fracticns inport Eracticnv,Decirel 

>>>x Fractin (7,3) 

>>>x 


Eracticn (7,3) 
>>>int (x) 把 分 数 转换 为 整数 


2 
>>>x=Decirel (10/3) 








>>>x 
Decimal ('3.333333333333333481363069950020872056484222412109375") 
>>>int (x) 把 高 精度 实数 转换 为 整数 


3 





>>>int('Ox22b'v16) 
555 

>>>int("22b"v16) 
555 

>>>int (pin (54321) ,2) 
54321 

>>>irt("Obll17) 
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起 十 六 进 制 数 转换 为 十 进 制 数 


衔 上 一 行 代码 等 价 


帮 - 进 制 与 十 进 制 之 间 的 转换 


徘 十 进 制 字符 串 进 , 必 须 指定 第 二 个 参数 


Valuegrror: irvalid literal for int() with base 10: '0b111' 


>>>int ("0b111',0) 
相 
>>>int ('0b111',6) 


第 二 个 参数 0 表示 使 用 字符 串 隐 含 的 进 制 


第 二 个 参数 应 与 隐 含 的 进 制 一 致 


Valuegrror: irvalid literal for int() with base 6: "Opbll1" 


>>>int ('0b111',2) 
>>>int ('111',6) 
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内 置 函数 float( ) 用 来 将 其 他 类 型 数据 转换 为 实数 ,complex( ) 可 以 用 来 生成 复数 。 


>>>float (3) 

3.0 

>>>float ('3.5') 

3.5 

>>>f1oat (‘inf') 

inf 

>>>corplex (3) 

GB3+0j) 

>>>onplex (3,5) 

G +5]j) 

>>>omplex ('inf') 
(inf +0j) 

>>>f1oat (‘nan') 

nan 
>>>coplex(nan') 
(nan +0j) 

>>>nan =fHloat (nan') 
>>>nan==Hoat (‘nan') 
False 


>>>nan >=Hoat (nan') 


False 
>>>nan <=Hoat (‘nan') 
False 


(2) ord( ) 和 chr( ) 是 一 对 功能 相反 的 函数 ,ord( ) 用 来 返回 单个 字符 的 Unicode 码 ， 


好 符 串 没有 隐 含 进 制 


第 二 个 参数 可 以 为 2~ 36 之 间 的 数字 


把 整数 转换 为 实数 

怒 数 字 字 符 串 转换 为 实数 
妩 穷 大 ,其 中 inf 不 区 分 大 小 写 
目 定 实 部 

目 定 实 部 和 虚 部 

谍 穷 大 


看 数 字 ,not a nniber 的 缩写 


得 法 比较 大 小 
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. 
而 chr( ) 则 用 来 返回 Unicode 编码 对 应 的 字符 ,str( ) 则 直接 将 其 任意 类 型 参数 转换 为 字 
符 串 。 


>>>ord('a') 得 看 指定 字符 的 uniccae 编码 
Ei 

>>>chr (65) 上 回 数字 65 对 应 的 字符 

‘a! 

>>>chr (ord('A') 1) fythcn 不 允许 字符 串 和 数字 之 间 的 加 法 操作 
'B! 

>>>qhr(ord(' 国 ') 匡 ) 破 持 中 文 

"图 下 

>>>ord(' 董 ) 化 个 用 法 仅 适 用 于 Python 3.x 
33891 

>>>ord(' 付 ') 
20184 

>>>ord(' 国 ') 
22269 

>>>"'' .join trep (chr, G3891,20184,22269))) 

' 董 付 国 ' 

>>>str (1234) 慎 接 变 成 字符 串 

234， 

>>>str([1,2,3]) 

‘2,3]" 

>>>str((1,2,3)) 

"(2,3)" 

>>>str({1,2,3}) 

"{1,2,3}" 

内 置 类 ascii 可 以 把 对 象 转换 为 ASCII 码 表示 形式 ,必要 的 时 候 使 用 转 义 字符 来 表示 

特定 的 字符 。 

>>>ascii ('a') 

am 

>>>ascii (' 董 付 国 ') 

”ANNaB463\Na4eaB \\u56fd'" 

>>>eval( ) 峙 字符 串 进行 求 值 

' 董 付 国 ' 


内 置 类 bytes 用 来 生成 字 节 串 ,或 者 把 指定 对 象 转换 为 特定 编码 的 字 节 趾 。 


>>>Htytes () 奸 成 空 字 节 串 

pb" 

>>>bytes G) 尾 成 长 度 为 3 的 字 节 串 
b' \yD0 vs00Na00" 

>>>pytes (" 董 付 国 ', "utf -8') 把 字符 串 转 换 为 字 节 串 
b' ve8 Nel ve3 VE4 Wi 98 ve5 Yobvaa' 
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>>>pytes (' 董 付 国 ','goxk') 大 以 指定 不 同 的 编码 格式 

b' vb6 Yad Wit8 vab6 Viog vefar 

>>>str( , 'gok') 芋 用 同样 的 编码 格式 进行 解码 

' 董 付 国 ' 

>>>' 董 付 国 '.encoge ('gok') 笠 价 于 使 用 bytes 0 进行 转换 

b' vib6 Yad Yio8 vab6 viog vefar 

>>> .Gecode (‘gok') 冬 价 于 使 用 str0 进 行 转换 

' 董 付 国 ' 

>>>x=' 董 付 国 '.encoge 0 

>>>1ist (x) 把 字 节 串 转换 为 列表 

[232,145,163,228,187,152,229,155,189] 

>>>bytes( ) 把 整数 列表 转换 为 字 节 串 

b' VE8 Vol Ya3 VE4 vibve8 VE5 Yobvaa' 

>>> .decode0 

' 董 付 国 ' 

(3) list( ) ,tuple( ) 、dict( ) ,set( ) ,frozenset( ) 用 来 把 其 他 类 型 的 数据 转换 成 为 列表 、 
元 组 ,字典 可 变 集 合 和 不 可 变 集合 ,或 者 创建 空 列表 、 空 元 组 、 空 字典 和 空 集合 。 


>>>list (range 5)) 凤 range 对 象 转换 为 列表 

[0,1,2,3,4] 

>>>bple( ) #- 个 下 面 线 表 示 上 一 次 正确 的 输出 结果 

(0,1,2,3,4) 

>>>dict (zip('1234', 'abode')) 利 建 字典 

tM 2 ey 

>>>set ('1112234') 创建 可 变 集合 ,自动 去 除 重复 

{4 2",'3",'1'} 

>>>_ .acd('5') 

>>>_ 

A 

>>>frozenset ('1112234') 伸 建 不 可 变 集 合 , 自 动 去 除 重 复 

frozenset ({'2','1"','3','4')) 

>>>_ .add('5') 环 可 变 集 合 frozenset 不 支持 元 素 添加 与 删除 

ttributsprror: 'frozenset' doject has np attripute ‘acd' 

实际 上 ,这 里 的 list、tuple、dict 、set、frozenset 以 及 前 面 刚 刚 介 绍 的 int float .complex 、 
bytes .str 都 是 Python 的 内 置 类 。 之 所 以 可 以 把 这 些 类 像 函 数 一 样 调用 ,是 因为 构造 方法 
的 存在 。 也 就 是 说 ,上 面 的 操作 实际 上 是 间接 地 调用 了 这 些 类 的 构造 方法 。 另 外 ,由 于 这 
些 函 数 的 调用 会 生成 新 的 类 型 ,也 往往 被 称 为 “工厂 函数 " 。 

(4) 内 置 函数 type( ) 和 isinstance( ) 可 以 用 来 判断 数据 类 型 ,常用 来 对 函数 参数 进行 
检查 ,可 以 避免 错误 的 参数 类 型 导致 函数 崩溃 或 返回 意料 之 外 的 结果 。 不 过 ,从 另 一 方面 
来 讲 , 过 多 的 使 用 type( ) 和 isinstance( ) 函数 会 在 一 定 程度 上 影响 多 态 ,建议 谨慎 使 用 。 


>>>type G) 次 看 3 的 类 型 
<class 'int'> 


SS 
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>>>bype(B]) 
<class 'list'> 

>>>type (3D) in Qist, tuple,dict) 
False 

>>>type({3) in (Qist, tuple,dict, set) 


True 
>>>isinstance Gint) 
True 
>>>isinstance (3j, int) 
False 
>>>isinstance Bj, (int, float, omplen) ) 


True 


得 看 B] 的 类 型 


制 | 断 {13] 是 否 为 liist,tbqple 或 dict 类 型 的 实例 


出 断 {3} 是 否 为 ist、tuple.dict 或 set 的 实例 


制 断 3 是 否 为 int 类 型 的 实例 


删 断 3 是 否 为 imt、 旦 cet 或 cmplex 类 型 的 实例 


内 置 函数 callable( ) 用 来 测试 对 象 是 否 可 调用 ,Python 中 函数 和 类 都 是 可 调用 的 ， 


包含 _call_() 方 法 的 类 的 对 象 也 是 可 调用 的 。 另 外 ,Python 标准 库 inspect 提供 了 
isclass( ) ,ismethod( ) ,isgenerator( ) ,isroutine( ) 等 大 量 函 数 用 来 测试 对 象 类 型 , 感 兴 趣 的 
读者 可 以 深入 挖掘 一 些 ,或 许 会 有 意外 惊喜 。 


242 最 值 与 求 和 


max( ) .min( ) ,sum( ) 这 3 个 内 置 函 数 分 别 用 于 计算 列表 、 元 组 或 其 他 包含 有 限 个 元 


>>>fram randam inport rancint 
>>>a=[randint (1,100) for i in range (10)] 
>>>Print trex (a) ,min (a) , sm(a)) 
>>>sum(a) /len (a) 


素 的 可 迭代 对 象 中 所 有 元 素 最 大 值 . 最 小 值 以 及 所 有 元 素 之 和 。sum( ) 默认 (可 以 通过 
start 参数 来 改变 ) 支持 包含 数值 型 元 素 的 序列 或 可 迭代 对 象 ,max( ) 和 min( ) 则 要 求 序 列 
或 可 迭代 对 象 中 的 元 素 之 间 可 比较 大 小 。 


想 含 10 个 0Q,100] 之 间 随 机 数 的 列表 
九 大 值 . 最 小 值 .所 有 元 素 之 和 
评 均值 


函数 max( ) 和 min( ) 还 支持 default 参数 和 key 参数 ,其 中 default 参数 用 来 指定 可 过 


代 对 象 为 空 时 默认 返回 的 最 大 值 或 最 小 值 , 而 key 参数 用 来 指定 比较 大 小 的 依据 或 规则 ， 
可 以 是 函数 或 lambda 表达 式 。 函 数 sum( ) 还 支持 start 参数 ,用 来 控制 求 和 的 初始 值 。 


>>>mex(['2','111']) 环 指定 排序 规则 


be 


>>>mex(['2','111'],key en) 由 回 最 长 的 字符 串 


11' 


>>>print tax([],default -None)) 时 空 列表 求 最 大 值 ,返回 空 值 Nne 


None 
>>>fram random inport randint: 


>>>1st =[ [randint 4,50) for i in range 5)] for j in range G0)] 
副 表 推导 式 , 生 成 包含 30 个 子 列表 的 列表 
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壮 个 子 列表 中 包含 5 个 介 于 [0,50] 区 间 的 整数 


>>>mex (st, key =sum) 版 回 元 素 之 和 最 大 的 子 列表 , 略 去 结果 
>>>mex (1st, key =sum) 相 上 面 的 代码 等 价 ,这 是 max 0 的 另 一 个 用 法 
>>>mrex (1st,key arbda x: x[1]) ”新 有 子 列表 中 第 2 个 元 素 最 大 的 子 列 表 
>>>sm(range (1,11)) 翅 m() 函 数 的 start 参数 默认 为 0 
55 
>>>sum(range (1,11),5) 盱 定 start 参数 为 5, 等 价 于 5+sm(range (1,11)) 
60 
>>>sum([01,2], [3], [4]],D) 娘 个 操作 占用 空间 较 大 , 慎 用 
[1,2,3,4] 


>>>sumC* 交 for i in range C00)) 入 比 数列 前 n 项 的 和 ,博世 机 站 十 … 所 199 
1606938044258990275541962092341162602522202993782792835301375 


>>>int ('1' * 200,2) 笠 价 于 上 一 行 代码 ,但 速度 快 很 多 
1606938044258990275541962092341162602522202993782792835301375 
>>>int ('1' * 200,7) 楷 值 9 为 2~36 之 间 的 整数 时 ,都 可 以 这 样 做 


1743639715219059529169816601969468943303198091695038943325023347339187627904043 
7086290637691515606750488442080420910523623438633906139318646917923778899694224 39576020000 


>>>sum(range (101)) 有 01 个 人 开会 ,互相 握手 次 数 ,不 重复 握手 
5050 

>>101 疯 00 // 2 三 个 人 都 与 其 他 所 有 人 握手 ,但 不 重复 握手 
5050 


如 果 用 help( ) 函数 查看 sum( ) 函数 的 帮助 文档 时 ,会 发 现 sum( ) 函数 的 最 后 一 个 参 
数 是 斜 线 ,实际 上 这 个 斜 线 并 不 是 sum( ) 函数 的 参数 ,只 是 用 来 表明 这 个 函数 只 接收 位 置 
参数 ,而 不 允许 以 关键 参数 的 形式 进行 传 值 ,如 果 遇 到 其 他 函数 或 对 象 方法 显示 这 样 的 帮 
助 文档 也 表示 同样 的 含义 。 这 样 的 函数 是 用 C 开发 的 ,并 对 参数 传 值 形式 做 了 要 求 ,在 
Python 中 并 不 允许 定义 这 样 的 函数 。 这 涉及 Argument Clinic 的 概念 , 感 兴趣 的 朋友 可 以 
查阅 有 关 资 料 。 


>>>help (sm) 得 看 am0) 函 数 的 帮助 
Help cn built -in fmcticn sm in modale builtins: 


sum(iteraple, start =0,/) 
Retim the sum of a 'start' velue (Gefault: 0) plus an iterable of mnbers 


VWhen the iterable js arpty, retum the start value. 


reject ncn meric types. 
>>>sm([1,2,3],4) 科 位 置 参 数 对 start 进行 传 值 
10 
>>>sm([1,2,3],start 4) 征 允 许 使 用 关键 参数 ,引发 异常 
TYPeError: sm() takes no keyword arguments 
>>>Gef dep abr/) : 症 Python 中 不 允许 这 样 定义 函数 ,语法 错误 


SyntaxError: irvalid syntax 
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243 基本 输入 输出 


input( ) 和 print( ) 是 Python 的 基本 输入 输出 函数 ,前 者 用 来 接收 用 户 的 键盘 输入 ,后 
者 用 来 把 数据 以 指定 的 格式 输出 到 标准 控制 台 或 指定 的 文件 对 象 。 不 论 用 户 输入 什么 内 
容 ,input( ) 一 律 作为 字符 串 对 待 ,必要 的 时 候 可 以 使 用 内 置 函数 int( ) \float( ) 或 eval() 
对 用 户 输 入 的 内 容 进行 类 型 转换 。 


>>>x imput ('Please irput: ') 

Please irput: 345 

>>>x 

‘345" 

>>>type (四 把 用 户 的 输入 作为 字符 串 对 待 
<class 'str' > 

>>>int (x) 艇 换 为 整数 

345 

>>>eval (x) 好 字符 串 求 值 , 或 类 型 转换 
345 

>>>x =irput ('Please irput: ') 

Please irput: [1,2,3] 

>>>x 

[1,2,3]" 

>>>type (x) 

<class 'str' > 

>>>eval (x) 

[1,2,3] 

>>>x =irput ('Please irpt:") 杯 论 用 户 输入 什么 ,都 作为 一 个 字符 串 来 对 待 
Please input:'hello world' 

>>>x 效果 本 来 就 想 输入 字符 串 ,就 不 用 再 输入 引号 了 
"hello world'" 

>>>eval (x) 

"hello world' 


内 置 函数 print( ) 用 于 输出 信息 到 标准 控制 台 或 指定 文件 ,语法 格式 为 
print (wualuel,valusp,……vsep=' ',end="' \n', file =sys.stdout, Flush -False) 


其 中 ,sep 参数 之 前 为 需要 输出 的 内 容 ( 可 以 有 多 个 ) ;sep 参数 用 于 指定 数据 之 间 的 分 隔 
符 , 默 认为 空格 ;file 参数 用 于 指定 输出 位 置 ,默认 为 标准 控制 台 ,也 可 以 重 定 向 输出 到 文 
件 。 例 如 : 


>>>print (,3,5,7,sep="' \t") 舱 改 默认 分 隔 符 


4 
>>>for i in range (10): 艇 改 ema 参数 ,每 个 输出 之 后 不 换行 
Print (i,end=" ') 


0123456789 
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>>>with apen (test.bt 'a+"') as ff: 
print ("Hello world! ,Gile= 名 ) 重 定向 ,将 内 容 输出 到 文件 中 


另外 ,Python 标准 库 sys 还 提供 了 read( ) 和 readline( ) 方 法 用 来 从 键盘 接收 指定 数量 
的 字符 。 例 如 : 


>>>inport sys 

>>>x =sys.stdin.read (5) 睹 取 5 个 字符 ,如 果 不 足 5 个 ,等 待 继续 输入 
asd 

5 

>>>x 

‘asd\ns! 

>>>x =5ys.stdin.read (5) 赎 取 5 个 字符 ,如 果 超 出 5 个 ,截断 
badefighijklmop 

>>>x 

i 

>>>x =sys.stdin.read (5) 类 缓 冲 区 内 继续 读 取 5 个 字符 

>>>x 

‘fdhij' 

>>>x =5y5.stdin.read (5) 

>>>x 

i 

>>>x =sys.stdin.read (5) 艘 冲 区 内 不 足 5 个 字符 ,就 等 待 用 户 继续 输入 
1234 

>>>x 

PNnl23" 

>>>x =sys.stdin.readline () 类 缓 冲 区 内 读 取 字符 ,过 到 换行 符 就 结束 
>>>x 

ian 

>>>x =Sy5.stdin.readline() 

abad 

>>>x 

‘abad nr 

>>>x =sys.stdin.readline (13) 制 果 缓冲 区 内 容 比 需要 的 少 , 遇 到 换行 符 也 结束 
abcuefg 

>>>x 

'abojefg\n' 

>>>x =5ys.stdin.readline (13) 茹 果 缓 冲 区 内 容 比 需要 的 多 ,就 截断 
abccefghijklmaparst 

>>xx 

"abccefghijklm' 

>>>x =sys.stdin.readline (13) 类 缓 冲 区 继续 读 取 

>>xx 


opqrstmn' 
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Python 标准 库 pprint 则 提供 了 更 加 友好 的 输出 函数 (pretty printer) pprint( ) ,可 以 更 
好 地 控制 输出 格式 ,如 果 要 输出 的 内 容 多 于 一 行 则 会 自动 添加 换行 和 缩 进 来 更 好 地 展示 
内 容 的 结构 。 例 如 : 
>>>import pprint 
>> 光 =[[[['black'v 'cyan'], "white', ['green', "red"]], [['megenta', "yellow'], "blue']]] 
>>>print .pprint (t) 区 认 width=80 
[[[["black' 'cyan'], white', ['green', ‘red']], 
[['megenta', 'yellow'], "blue']]] 
>>>pprint .pprint (t,width =50) 
[[[["baack' 'cyen'], white', ['green', "red']], 
[['megenta', 'yellow'], "blue']]] 
>>>Fprint .pprint (t,width =30) 根据 需要 进行 换行 和 缩 进 
[[[['blackv ‘cyan'], 
"white', 
['grean', ‘red']], 
[['magenta', 'yellow'], 
"blue']]] 


244 排序 与 逆序 


sorted( ) 对 列表 ,元 组 .字典 ,集合 或 其 他 可 迭代 对 象 进 行 排序 并 返回 新 列表 ,reversed 
( ) 对 可 壕 代 对 象 ( 生 成 器 对 象 和 具有 惰性 求 值 特性 的 zip .map \filter ,enumerate 等 类 似 对 
象 除外 ) 进 行 翻转 (首尾 交换 ) 并 返回 可 迭代 的 reversed 对 象 。 

>>>x =1ist (range (11)) 

>>>inport random 


>>>rancam. shuffle (x) 雪 乱 顺序 

>>>x 

[2,4,0,6,10,7,8,3,9,1,5] 

>>>sorted (x) 各 默认 规则 排序 


[0,1,2,3,4,5,6,7,8,9,10] 
>>>sorted (x, key <lanbda item:len (str (item) ) , reverse =True) 

退 转 换 成 字符 串 以 后 的 长 度 降序 排列 
[10,2,4,0,6,7,8,3,9,1,5] 


>>>sorted Co key =str) 碗 转换 成 字符 串 以 后 的 大 小 升序 排列 
[0,1,10,2,3,4,5,6,7,8,9] 
ES 环 影响 原来 列表 的 元 素 顺 序 


[2,4,0,6,10,7,8,3,9,1,5] 
>>>x =['aaaa', bc', 'd', mb "ba'] 
>>>sorted (x, key <lanbda item: (en (item) ,item) 
上 竹 按 长 度 排序 ,长 度 一 样 的 正常 排序 
[mbv "dv ba', "bc raaaa'] 
>>>reversed (x) 毁 序 ,返回 reversed 对 象 
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<list_ reverseiterator doject at 0x0000000003089E48 > 
>>>1ist (reversed (x)) teversed 对象 是 可 迁 代 的 
[5,1,9,3,8,7,10,6,0,4,2] 


245 枚 举 与 迭代 


enumerate( ) 因数 用 来 枚 举 可 帮 代 对 象 中 的 元 素 ,返回 可 迁 代 的 enumerate 对 象 ,其 中 
每 个 元 素 都 是 包含 索引 和 值 的 元 组 。 


>>>1ist (enmerate ('abod')) 才 举 字符 串 中 的 元 素 
[Oa my Ee) Ga) 
>>>1ist (enurerate (['Python', 'Greate'])) 政 举 列表 中 的 元 素 


[(0, 'Python'), (1, 'Greate')] 

>>>list (enumerate ({'a':97, "pb':98, 'c':99}.itars (0))) ” 政 举 字典 中 的 元 素 

[0, ('c',99)), 0, (av97))，Cv (Wb',98))] 

>>>for incexvvalue in emerate (range (10,15)) : 艇 举 range 对 象 中 的 元 素 
Print ( (index, value) ,end=" ') 

(0,10) Q,11) CQ,12) G,13) (4,14) 


内 置 函数 enumerate( ) 还 支持 一 个 start 参数 ,用 来 指定 枚 举 时 的 索引 起 始 值 。 


>>>for item in enumerate (range (5) ,6) : 伺 引 从 6 开始 
print (item,end=", ') 

(6,0), (7,1), (8,2), (9,3), (10,4), 

iter( ) 师 数 用 来 返回 指定 对 象 的 迭代 器 ,有 两 种 用 法 : iter( iterable) 和 iter( callable， 
sentinel) ,前 者 要 求 参 数 必须 为 序列 或 者 有 自己 的 迭代 器 ,后 者 会 持续 调用 和 参数 callable 
直至 其 返回 sentinel。next( ) 函数 用 来 返回 可 迭代 对 象 中 的 下 一 个 元 素 ,适用 于 生成 器 对 
象 以 及 zip、enumerate 、reversed .map ,filter ,iter 等 对 象 ,等 价 于 这 些 对 象 的 __next__() 
方法 。 


>>>x=[1,2,3] 

>>>next (x) 

TYPEError: 'list' doject is nct an iterator 

>>>y =iter co 根据 列表 创建 迭代 器 对 象 
>>>next (y) 

全 

>>>next (y) 

>>>x =range (1,100,3) 

>>>nest (x) #ange 对 象 不 是 迭代 器 对 象 
TYPsError: 'range' abject is not an iterator 

>>>x =iter co 把 mange 对象 转换 为 迭代 器 对 象 
>>>next (x) 

1 


® 
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>>>next (2) 
a 
>>>x ={1,2,3} 
>>>y iter (x) 
>>>next (y) 





>> 污 了 (range 3)) 
>>>next (t) 


TypeError: 'T' doject js not an iterator 


>>>ti =iter (t) 
>>>next (ti) 
0 
>>>next (ti) 
1 
>>>fram queve inport Quoeue 
>>>qoueue0 
>>>for i in range (5): 
GEPut (G) 
>>>GPIL( END') 
>>>Gef test(): 
TEtbam q.get() 


>>>for item in iter (test, "END') : 


Frint (itemwend=" ') 
01234 
>>>x mep (int, '1234') 
>>>next (x) 


>>>x =reversed ("12345678") 
>>>for i in range (4) : 

Print next (%) ,end =" ') 
8765 


>>>x =enmerate ({'a' :97, 'b' :98, 'c' :99} .items ()) 


>>>nest (x) 
(0, ('c',99)) 


得 据 集合 创建 迭代 器 对 象 


竺 殊 方法 ,对 应 于 内 简 函 数 iter() 


峰 象 七 不 可 迭代 


和 根 据 七 创建 迭代 器 对 象 


创建 队列 对 象 


站 次 放 入 5 个 数字 


散 入 结束 标志 


桂 续 执行 test 0 函数 ,直到 返回 "mp' 


ep 对 象 支持 next 0 函数 


特殊 方法 ,等 价 于 next (x) 


kewersed 对 象 支持 next 0 函数 


fmmerate 对 象 支持 next 0 函数 
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246 reap() reduce() filter() 


map( ) .reduce( ) ,filter( ) 是 Python 中 很 常用 的 几 个 函数 ,也 是 Python 支持 函数 式 编 
程 的 重要 体现 。 要 注意 的 是 ,在 Python 3. x 中 ,reduce( ) 不 是 内 置 函 数 , 而 是 放 到 了 标准 
库 functools 中 ,需要 先导 和 再 使 用 。 

函数 式 编程 把 问题 分 解 为 一 系列 的 函数 操作 ,输入 依次 流入 和 流出 一 系列 函数 ,最 终 
完成 预定 任务 和 目标 。 在 理想 状态 下 ,每 个 函数 只 是 接收 输入 并 在 简单 处 理 后 产生 输出 ， 
这 些 输 出 完全 取决 于 输入 和 函数 指定 的 操作 并 且 仅 通过 函数 返回 值 来 体现 ,而 不 会 引入 
或 造成 任何 副作用 (例如 ,输入 和 一 些 内 部 状态 共同 决定 输出 ,修改 输入 的 数据 、 把 一 些 
数据 和 状态 输出 到 屏幕 或 文件 等 ) 。 函 数 式 编程 具有 很 多 优点 ,例如 ,容易 构建 一 个 数学 
模型 来 证 明 程序 的 正确 性 ,程序 更 加 模块 化 ,容易 调试 和 测试 ,代码 复 用 率 高 ,等 等 。 

内 置 函数 map( ) 把 一 个 函数 fune 依次 映射 到 序列 或 迭代 器 对 象 的 每 个 元 素 上 ,并 返 
回 一 个 可 迁 代 的 map 对 象 作为 结果 ,map 对 象 中 每 个 元 素 是 原 序 列 中 元 素 经 过 机 数 func 
处 理 后 的 结果 ,map( ) 函数 不 对 原 序列 或 迭代 器 对 象 做 任何 修改 。 


>>>1ist rep (str, range (5))) 怒 列 表 中 元 素 转换 为 字符 串 

[ov 1 2 ,3,4'] 

>>>aef act5 kw) : 婵 参 数 函 数 
ITebmmvV45 

>>>list ep (ac5, range (10))) 把 单 参数 函数 映射 到 一 个 序列 的 所 有 

元 素 

[5,6,7,8,9,10,11,12,13,14] 

>>>def acd(x,y) : 全 以 接收 2 个 参数 的 函数 
rebmx+y 

>>>1ist rep (ac range (5) ,range 5,10))) 由 双 参 数 函 数 映 射 到 两 个 序列 上 

[5,7,9,11,13] 

>>>1ist (rep (lanbda x,y: x+y, range (5) ,range 5,10))) 

[5,7,9,11,13] 

>>>Gef myMap (Lst,value) : 相 定 义 函 数 
retim mep (lanbda item: item Walue, 1st) 

>>>1ist mMep (range (5) ,5)) 壮 个 数字 加 5 

[5,6,7,8,9] 

>>>1ist myMep (range (5) ,8)) 壮 个 数字 加 8 

[8,9,10,11,12] 

>>>aef myMap (itersble,apyvalue) : 相 定 义 函 数 
if pnct in + 一 /': 羔 现 序列 与 数字 的 四 则 运算 


retum "Error qperator' 
fimnc “lanbda i:eval (repr (i) +cp +repr (value)) 
retim rep (finc, iterable) 
>>>1ist (ryMep (range G)， +',5)) 
[5,6,7,8,9] 
>>>1ist (ryMep (range 5),' 一 5)) 


45 
® 
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[-5, 4, -3, 2, 1] 
>>>list tmyMep (range (5) , ' * ',5)) 
[0,5,10,15,20] 
>>>list meep (range (5) , '/',5)) 
[0.0,0.2,0.4,0.6,0.8] 

>>>import randam 


>>>x =random. randint (1,1e30) 硅 成 指定 范围 内 的 随机 整数 
>>>x 

839746558215897242220046223150 

>>>list ep (int, str (x))) 姐 取 大 整数 每 位 上 的 数字 


[8,3,9,7,4,6,5,5,8,2,1,5,8,9,7,2,4,2,2,2,0,0,4,6,2,2,3,1,5,0] 


标准 库 functools 中 的 函数 reduce( ) 可 以 将 一 个 接收 2 个 参数 的 函数 以 欠 代 累积 的 方 
式 从 左 到 右 依 次 作用 到 一 个 序列 或 迭代 器 对 象 的 所 有 元 素 上 ,并 且 人 允许 指定 一 个 初始 值 。 
例如 ,reduce(lambda x, y: x+y, [1, 2, 3, 4, 5] ) 计算 过 程 为 ((((1+2) +3) +4) + 
5) ,第 一 次 计算 时 x 为 1 而 y 为 2, 再 次 计算 时 x 的 值 为 (1 +2) 而 y 的 值 为 3, 再 次 计算 时 
x 的 值 为 ((1 +2) +3) 而 y 的 值 为 4, 以 此 类 推 ,最 终 完 成 计算 并 返回 ((((1+2) +3) + 


4) +5) 的 值 。 
>>>fram finctools inport Tecuce 
>>>seq 1ist (range (1,10)) 她 可 以 不 用 转换 为 列表 
>>>recuce (ac seq) 是 上 一 段 代码 中 定义 的 函数 
45 
>>>reduce (lanibda x,y: x+yyseg) 本 用 lanbca 表达 式 实现 相同 功能 
45 
上 面 实现 数字 累加 的 代码 运行 过 程 如 图 2-1 所 示 。 
>>>inport cperator 标准 库 qperator 提供 了 大 量 运算 
>>>qperator.acd (3,5) 机 以 像 普 通 函 数 一 样 直接 调用 
8 
>>>reduce (aperator.acb seq) 看 用 acd 运 算 
45 
>>>recuce (aperator.acbl seg, 5) 由 定 累加 的 初始 值 为 5 
50 
>>>reduce (aperator .mul, seq) 夷 法 运算 
362880 
>>>reduce (aqperator ml, range (1,6)) 下 的 阶乘 
120 
>>>reduce (aperatior .ach, map (str, seq) ) 艇 换 成 字符 串 再 累加 
'123456789"' 
>>>' .join rap (str, seq) ) 姜 用 join0 方 法 实现 字符 串 连接 
'123456789' 
>>>reduce (aperator.actl [[1,2], B31], []) 仇 个 操作 占用 空间 较 大 , 慎 用 


0D,2,3] 
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图 2-1 reduce( ) 函数 执行 过 程 示意 图 


与 上 面 代 码 中 最 后 演示 的 用 法 类 似 , 作 为 一 种 技巧 ,reduce( ) 函数 还 支持 下 面 的 用 法 
(感谢 浙江 省 浦江 中 学 方 春 林 老 师 提供 本 例 用 法 ): 
>>>fram Tancom inport ranciint 
>>>1st =[randint ( ,10) for i in range (50)] 
>>>Gef 七 Nom(dic,k) : 
if k indic: 
dic[kW + 习 
else: 
dic[kK] 导 1 
retum dic 
>>>recbce (tNm, 1st, {}) 
G2 D3 Ga: 46 71772 5B: 59 GIDe'5} 
内 置 函数 filter( ) 将 一 个 单 参 数 函 数 作 用 到 一 个 序列 上 ,返回 该 序列 中 使 得 该 函数 返 
回 值 为 True 的 那些 元 素 组 成 的 filter 对 象 ,如 果 指 定 函 数 为 None, 则 返回 序列 中 等 价 于 
True 的 元 素 。 


>>>seq=['foo', "da10 31 ',' 灶 洲 下 1] 
>>>cef Fine co : 


瞪 机 数列 表 
琉 计 元 素 出 现 次 数 


retim x.isalnm() 调试 是 否 为 字母 或 数字 
>>>filter (fonc, seq) 彼 回 filter 对 象 
<filter doject at 0x000000000305DB98 > 
>>>list (filter (finc, seq) ) 把 filter 对 象 转换 为 列表 
['foo', ‘x41"] 
环 对 原 列表 做 任何 修改 


>>>seq 
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[roor, ee es > 
>>>[x for x in seq if x.isalnm()] 芋 用 列表 推导 式 实现 相同 功能 
[rioov wd9 
>>>1ist (filter (lanbda x: xisalnm(),sea) 竺 用 lanibda 表达 式 实现 相同 功能 
[rioov A11] 
>>>1ist (filter (None, [1,2,3,0,0,4,0,5])) 精 定 函数 为 Nane 
[1,2,3,4,5] 

247 range() 


range( ) 是 Python 开发 中 非常 常用 的 一 个 内 置 函 数 ,语法 格式 为 range ([ start,] 
end [ ，step] ) ,有 range( stop) .range( start，stop) 和 range(start，stop ，step )3 种 用 法 。 该 
函数 返回 具有 惰性 求 值 特 点 的 range 对 象 ,其 中 包含 左 闭 右 开 区 间 [ start,end) 内 以 step 为 
步 长 的 整数 。 参 数 start 默认 为 0,step 默认 为 1。 


>>>range (5) tart 默 认为 0,step 默 认为 1 
range (0,5) 

>>>list( ) 

[0,1,2,3,4] 

>>>1ist (range (1,10,2)) 目 定 起 始 值 和 步 长 

[1,3,5,7,9] 

>>>1ist (range (9,0, -2)) 帖 长 为 负数 时 ,start 应 比 end 大 
[9,7,5,3,1] 


在 循环 结构 中 经 常 使 用 range( ) 函数 来 控制 循环 次 数 ,例如 : 
>>>for i in range (4): 循环 4 次 


Print (3,end="' ') 
3333 


当然 ,也 可 以 使 用 range( ) 函数 来 控制 数值 范围 ,例如 ,下 面 的 程序 片段 可 以 用 来 输 
出 200 以 内 能 被 17 整除 的 最 大 正 整数 。 


for i in Iange(200,0, 1): 


if i%17==0: 
Print (i) 
Preak 
248 aip() 


zip( ) 郴 数 用 来 把 多 个 可 选 代 对 象 中 的 元 素 压 缩 到 一 起 ,返回 一 个 可 和 迭代 的 zip 对 象 ， 
其 中 每 个 元 素 都 是 包含 原来 的 多 个 可 迭代 对 象 对 应 位 置 上 元 素 的 元 组 ,最 终结 果 中 包含 
的 元 素 个 数 取 决 于 所 有 参数 序列 或 可 和 迭代 对 象 中 最 短 的 那个 。 可 以 这 样 理解 这 个 函数 ， 
把 多 个 序列 或 可 选 代 对 象 中 的 所 有 元 素 左 对 齐 ,然后 像 拉 拉链 一 样 往 右 拉 ,把 所 经 过 的 每 
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个 序列 中 相同 位 置 上 的 元 素 都 放 到 一 个 元 组 中 ,只 要 有 一 个 序列 中 的 所 有 元 素 都 处 理 完 
了 就 不 再 拉 拉 链 了 ,返回 包含 若干 元 组 的 zip 对 象 。 


>>>list(zip(rabod' [1,2,3])) 年 缩 字符 串 和 列表 
[arvl) (b',2), ('c',3)] 


>>>1ist (zip('abad')) 寻 工 个 序列 也 可 以 压缩 

[Ca (Db) C00) 00,)] 

>>>1ist (zip('123", 'abc',',.! ')) 年 缩 3 个 序列 

机 

>>>for item in zip('abcd'range G)): 帮 ip 对 象 是 可 和 夺 代 的 
Print (item) 

(av0) 

('b',l) 

('c',2) 

>>>x zip('abod', "1234') 

>>>1ist (x) 

[av (Pb, 2"), (ce','3"), ('d','4')] 

>>>1ist (x) 此 ip 对 象 只 能 遍历 一 次 

0 


249 eal().eec) 


内 置 函数 eval( ) 用 来 计算 字符 串 的 值 ,在 有 些 场合 也 可 以 用 来 实现 类 型 转换 的 功能 ， 
这 个 用 法 在 2.4.1 节 和 2.4.3 节 出 现 过 多 次 ,这 里 不 再 重复 。 除 此 之 外 ,eval( ) 也 可 以 对 
字 节 串 进 行 求 值 ,还 可 以 执行 内 置 函数 compile( ) 编译 生成 的 代码 对 象 。 

>>>eval ID'34357) 

8 

>>>eval (oapile ('print (3 5) temp. 世 十 'exec')) 

8 


>>>eval ('9') 下 数字 字符 串 转换 为 数字 
Es 


>>>eval ('09') 于 出 异常 ,不 允许 以 0 开头 的 数字 
SyntaxError: irvalid token 
>>>int ("09') 化 样 转换 是 可 以 的 
9 
另外 ,由 于 eval( ) 并 不 对 参数 字符 串 进行 安全 性 检查 ,如 果 精 心 构造 一 些 语句 的 话 可 
能 会 引发 安全 漏洞 ,应 尽量 使 用 标准 库 ast 提供 的 安全 求 值 函数 literal_eval( ) 。 


>>>eval ("” import (os") -startfile (rc: Windows\\notepad.eme')") 


打开 记事 本 程序 
>>>import ast 


>>>ast.literal eval(” _inport _('os') -startfile (r'c: Windbows\\notepad.ee')") 
上 碟 法 执行 ,引发 异常 


® 





50 外 4 Python 程序 设计 开发 宝典 


VBlusprror: ralformed node or string: < ast.Call dvject at 0x00000000033F2C18 > 


内 置 函数 exec( ) 用 来 执行 指定 的 Python 源 代码 或 者 由 compile( ) 编译 的 代码 对 象 。 


>>>eec('x3") 执行 语句 xx 也 

>>>x 

支 

>>>exec ('help (sm ') 将 看 内 园 函 数 sam0 的 帮助 文档 
>>>cbj -ompile ('for i in range 5) :print (i,erd=" ") ', terp.tit', ‘eec') 

>>>coj 购置 函数 cmpile0 生 成 的 代码 对 象 
<coae aoject qdule >at 0x00000000033722900, file "temp.bdt" line1> 

>>>exec(coj) 车 用 eec0 执 行 代码 对 象 

位 全 33 阁 

>>>eval (cbj) 她 可 以 使 用 eval 0 执行 代码 对 象 
01234 

>>>cbj =corpile ('x =666', ‘tanp.tit', ‘emec') 

>>>eval (doj) 

>>>x 

666 

>>>for ivv in enumerate (range (5,10)): 盎 态 创建 变量 名 


exec ('element' +str (i) +' =" +str (v)) 


>>>elemento 
5 

>>>element] 
6 
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Python 中 常用 的 序列 结构 有 列表 .元 组 .字典 .字符 串 .集合 等 (虽然 有 人 并 不 主张 把 
字典 和 集合 看 作 序列 ,但 这 真 的 不 重要 ) ,从 是 否 有 序 这 个 角度 可 以 分 为 有 序 序列 和 无 序 
序列 ,从 是 否 可 变 来 看 则 可 以 分 为 可 变 序列 和 不 可 变 序列 两 大 类 ,如 图 3-1 所 示 。 另 外 ， 
生成 器 对 象 和 range ,map ,enumerate ,filter ,zip 等 对 象 的 某 些 用 法 也 类 似 于 序列 ,尽管 这 些 
对 象 更 大 的 特点 是 惰性 求 值 。 列 表 .元 组 .字符 串 等 有 序 序列 以 及 range 对 象 均 支持 双向 
索引 ,第 一 个 元 素 下 标 为 0 ,第 二 个 元 素 下 标 为 1 ,以 此 类 推 ;如 果 使 用 负数 作为 索引 , 则 最 
后 一 个 元 素 下 标 为 -1 ,倒数 第 二 个 元 素 下 标 为 -2, 以 此 类 推 。 可 以 使 用 负 整 数 作为 索引 





























是 Python 有 序 序列 的 一 大 特色 ,熟练 掌握 和 运用 可 以 大 幅度 提高 开发 效率 。 
一 [列表 
有 序 序列 元 组 可 变 序列 
不 可 变 序列 
E 序 序列 

















图 3-1 “Python 序列 分 类 示意 图 


3.1 列表 : 打 了 激素 的 数组 


列表 (list) 是 最 重要 的 Python 内 置 对 象 之 一 ,是 包含 若干 元 素 的 有 序 连续 内 存 空间 。 
当 列表 增加 或 删除 元 素 时 ,列表 对 象 自动 进行 内 存 的 扩展 或 收缩 ,从 而 保证 相 邻 元 素 之 间 
没有 缝隙 。Python 列表 的 这 个 内 存 自 动 管理 功能 可 以 大 幅度 减少 程序 员 的 负担 ,但 插入 
和 删除 非 尾 部 元 素 时 涉及 列表 中 大 量 元 素 的 移动 ,会 严重 影响 效率 。 另 外 ,在 非 尾部 位 置 
插入 和 删除 元 素 时 会 改变 该 位 置 后 面 的 元 素 在 列表 中 的 索引 ,这 对 于 某 些 操作 可 能 会 导 
致意 外 的 错误 结果 。 因 此 ,除非 确实 有 必要 ,否则 应 尽量 从 列表 尾部 进行 元 素 的 追加 与 删 
除 操作 。 
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在 形式 上 ,列表 的 所 有 元 素 放 在 一 对 方 括号 [ ] 中 , 相 邻 元 素 之 间 使 用 逗号 分 隔 。 在 
Python 中 ,同一 个 列表 中 元 素 的 数据 类 型 可 以 各 不 相同 ,可 以 同时 包含 整数 实数、 字符 串 
等 基本 类 型 的 元 素 ,也 可 以 包含 列表 元 组 ` 字 与 .集合 .函数 以 及 其 他 任意 对 象 。 如 果 只 
有 一 对 方 括号 而 没有 任何 元 素 则 表示 空 列表 。 下 面 几 个 都 是 合法 的 列表 对 象 

[10,20,30,40] 

["crunchy frog', 'ram blacter', 'lark vomit'] 

["'spam',2.0,5, [10,20]] 

[["'filel',200,7], ['file2',260,9]] 

[{3},{5:6}, (1,2,3)] 

Python 采用 基于 值 的 自动 内 存 管理 模式 ,变量 并 不 直接 存储 值 , 而 是 存储 值 的 引用 或 
内 存 地 址 ,这 也 是 python 中 变量 可 以 随时 改变 类 型 的 重要 原因 。 同 理 , Python 列表 中 的 
元 素 也 是 值 的 引用 ,所 以 列表 中 各 元 素 可 以 是 不 同类 型 的 数据 。 

需要 注意 的 是 ,列表 的 功能 虽然 非常 强大 ,但 是 负担 也 比较 重 ,开销 较 大 ,在 实际 开发 
中 ,最 好 根据 实际 的 问题 选择 一 种 合适 的 数据 类 型 ,要 尽量 避免 过 多 使 用 列表 。 


311 列表 创建 与 删除 

使 用 ”= "直接 将 一 个 列表 赋值 给 变量 即 可 创建 列表 对 象 。 

>>>a_list=['a', 'b', mpilgrim', 'z', 'exanple'] 

>>>a_list =[] 覃 建 空 列表 

也 可 以 使 用 list( ) 函数 把 元 组 ,range 对 象 .字符 串 .字典 .集合 或 其 他 可 迁 代 对 象 转换 
为 列表 。 需 要 注意 的 是 ,把 字典 转换 为 列表 时 默认 是 将 字典 的 “ 键 " 转 换 为 列表 ,而 不 是 
把 字典 的 元 素 转换 为 列表 ,如 果 想 把 字典 的 元 素 转换 为 列表 ,需要 使 用 字典 对 象 的 
items( ) 方 法 明确 说 明 ,当然 也 可 以 使 用 values( ) 来 明确 说 明 要 把 字典 的 “ 值 " 转换 为 


列表 。 
>>>1ist((3,5,7,9,11)) 糙 元 组 转换 为 列表 
[3,5,7,9,11] 
>>>1ist (range (1,10,2)) 将 range 对 象 转换 为 列表 
[1,3,5,7,9] 
>>>1ist ('hello world') 将 字符 串 转 换 为 列表 
[hev oo Ww or rl, qd'] 
>>>1ist ({3,7,5)) 将 集合 转换 为 列表 
[3,5,7] 
>>>1ist ({'a':3, 'b':9, 'c':78)) 将 字典 的 “ 键 "转换 为 列表 
Cavecv b'] 
>>>1ist ({'a':3, 'b':9, 'c':78}.items()) 将 字典 的 “ 键 : 值 ” 对 转换 为 列表 
[("b',9), ('c',78), ('a',3)] 
>>>x ist() 得 | 建 空 列表 


当 一 个 列表 不 再 使 用 时 ,可 以 使 用 del 命令 将 其 删除 ,这 一 点 适用 于 所 有 类 型 的 
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Python 对 象 。 
>>>x=[1,2,3] 
>>>ael x 制 除 列表 对 象 
>>>x 峙 象 删除 后 无 法 再 访问 , 抛 出 异常 


REmeError: neme 'x' is mot defined 
严格 来 说 ,del 命令 并 不 删除 变量 对 应 的 值 ,只 是 删除 变量 并 解除 变量 和 值 的 绑 定 。 
Python 内 部 每 个 值 都 维护 一 个 计数 器 ,每 当 有 新 的 变量 引用 该 值 时 其 引用 计数 器 加 1 , 当 
该 变量 被 删除 或 不 再 引用 该 值 时 其 引用 计数 器 减 1 , 当 某 个 值 的 引用 计数 器 变 为 0 时 则 
由 垃圾 回收 器 负责 清理 和 删除 。 如 果 需 要 立刻 进行 垃圾 回收 ,可 以 导入 gc 模块 后 调用 其 
collect( ) 方 法 。 
>>>inport sys 
>>>sys.getrefcount (1) 得 看 值 的 引用 次 数 
1243 
>>>x 习 
>>>sys.getrefoount (1) 才 新 变量 引用 该 值 , 其 引用 计数 器 加 1 
1244 
>>>y 习 
>>>sy5.getrefoont (1) 
1245 
>>>GEl x 删除 变量 并 解除 引用 ,该 值 的 引用 计数 器 减 1 
>>>Ge] Y 
>>>sys.getrefcount 0) 
1243 
>>>inport gc 
>>>gc.collect () 散 刻 进行 垃圾 回收 ,返回 被 清理 的 对 象 数 量 
0 


312 列表 元 素 访 问 


创建 列表 之 后 ,可 以 使 用 整数 作为 下 标 来 访问 其 中 的 元 素 ,其 中 下 标 为 0 的 元 素 表 示 
第 1 个 元 素 , 下 标 为 1 的 元 素 表示 第 2 个 元 素 , 下 标 为 2 的 元 素 表 示 第 3 个 元 素 , 以 此 类 
推 ;列表 还 支持 使 用 负 整 数 作为 下 标 ,其 中 下 标 为 -1 的 元 素 表 示 最 后 一 个 元 素 , 下 标 为 
-2 的 元 素 表示 倒数 第 2 个 元 素 , 下 标 为 -3 的 元 素 表示 倒数 第 3 个 元 素 , 以 此 类 推 ,如 
图 3-2 所 示 ( 以 列表 [中 ,YY，T, ho， om] 为 例 ) 。 


>>>x <1ist ('Python') 创建 类 别 对 象 

>>>x 

[Po Y th', or, n'] 

>>>x[0] 慎 标 为 0 的 元 素 , 第 一 个 元 素 


‘Pp! 
>>>x[ 1] 钙 标 为 二 的 元 素 , 最 后 一 个 元 素 


mr 


® 
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313 列表 常用 方法 


列表 ,元 组 字典 集合 .字符 串 等 Python 序列 有 很 多 操作 是 通用 的 ,而 不 同类 型 的 序 
列 又 有 一 些 特有 的 方法 或 者 支持 某 些 特有 的 运算 符 和 内 置 函 数 。 列 表 对 象 常 用 的 方法 如 


图 3-2 ”双向 索引 示意 图 








表 3-1 所 示 。 
表 3-1 列表 对 象 常用 的 方法 
方 法 说 明 
append(x) 将 x 追加 至 列表 尾部 
extend( L) 将 列表 工 中 所 有 元 素 追 加 至 列表 尾部 





insert( index, x) 


在 列表 index 位 置 处 插入 x, 该 位 置 后 面 的 所 有 元 素 后 移 并 且 在 列表 中 
的 索引 加 1, 如 果 index 为 正 数 且 大 于 列表 长 度 则 在 列表 尾部 追加 x, 如 
果 index 为 负数 且 小 于 列表 长 度 的 相反 数 则 在 列表 头 部 插入 元 素 x 





remove( x) 


在 列表 中 删除 第 一 个 值 为 x 的 元 素 ,该 元 素 之 后 所 有 元 素 前 移 并 且 索 
引 减 1, 如果 列表 中 不 存在 x 则 抛 出 异常 





pop( [index] ) 


删除 并 返回 列表 中 下 标 为 index 的 元 素 , 如 果 不 指定 index 则 默认 为 
-1 弹出 最 后 一 个 元 素 ; 如 果 弹 出 中 间 位 置 的 元 素 则 后 面 的 元 素 索 引 减 
1; 如 果 index 不 是 [ -L, L) 区 间 上 的 整数 则 抛 出 异常 ,L 表示 列表 长 度 














clear( ) 清空 列表 ,删除 列表 中 的 所 有 元 素 ,保留 列表 对 象 

返回 列表 中 第 一 个 值 为 x 的 元 素 的 索引 , 若 不 存在 值 为 x 的 元 素 则 抛 
index(x) 出 异常 

count(x) 返回 x 在 列表 中 的 出 现 次 数 

reverse( ) 对 列表 所 有 元 素 进 行 原 地 逆序 ,首尾 交换 











sort ( key = None，reverse = | 对 列表 中 的 元 素 进行 厚 地 排序 ,key 用 来 指定 排序 规则 ,reverse 为 False 
False) 表示 升序 ,Tme 表示 降序 
copy( ) 返回 列表 的 浅 复制 


1. append( ) ,insert( ) .extend( ) 


这 3 个 方法 都 可 以 用 于 向 列表 对 象 中 添加 元 素 ,其 中 append( ) 用 于 向 列表 尾部 追加 
一 个 元 素 ,insert( ) 用 于 向 列表 任意 指定 位 置 插入 一 个 元 素 ,extend( ) 用 于 将 另 一 个 列表 
中 的 所 有 元 素 追 加 至 当前 列表 的 尾部 。 这 3 个 方法 都 属于 原 地 操作 ,不 影响 列表 对 象 在 
内 存 中 的 起 始 地 址 。 对 于 长 列表 而 言 ,使 用 insert( ) 方 法 在 列表 首部 或 中 间 位 置 插入 元 
素 时 效率 较 低 。 如 果 确 实 需 要 在 首部 按 序 插入 多 个 元 素 的 话 , 可 以 先 在 尾部 追加 ,然后 再 
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使 用 reverse( ) 方 法 进行 翻转 ,或 者 考虑 使 用 标准 库 collections 中 的 双 端 队列 deque 对 象 
提供 的 appendleft( ) 方 法 。 


>>>x=[1,2,3] 


>>>id (x) 个 看 对 象 的 内 存 地 址 
50159368 

>>>x.append(4) 首尾 部 追加 元 素 
>>>x.insert (0,0) 和 症 指 定位 置 插入 元 素 
>>>x.extend([5,6,7]) 三 尾部 追加 多 个 元 素 
>>>x 

[0,1,2,3,4,5,6,7] 

>>>id (x) 而 表 在 内 存 中 的 地 址 不 变 
50159368 


2. pop() .remove( ) ,clear( ) 

这 3 个 方法 用 于 删除 列表 中 的 元 素 ,其 中 pop( ) 用 于 删除 并 返回 指定 位 置 (默认 是 最 
后 一 个 ) 上 的 元 素 , 如 果 指 定 的 位 置 不 是 合法 的 索引 则 抛 出 异常 ,对 空 列表 调用 pop( ) 方 
法 也 会 抛 出 异常 ;remove( ) 用 于 删除 列表 中 第 一 个 值 与 指定 值 相 等 的 元 素 , 如 果 列 表 中 不 
存在 该 元 素 则 抛 出 异常 ;clear( ) 用 于 清空 列表 中 的 所 有 元 素 。 这 3 个 方法 也 属于 原 地 操 
作 ,不 影响 列表 对 象 的 内 存 地 址 。 另 外 ,还 可 以 使 用 del 命令 删除 列表 中 指定 位 置 的 元 
素 , 同 样 也 属于 原 地 操作 。 


>>>x =[1,2,3,4,5,6,7] 


>>>x.Pop() 群 出 并 返回 尾部 元 素 

了 

>>>x-FPopO) 群 出 并 返回 指定 位 置 的 元 素 
时 

>>>x.clear (0) 删除 所 有 元 素 

>>>x 


0 
>>>x=[1,2,1,1,2] 


>>>x.remve 2) 删除 首 个 值 为 2 的 元 素 
>>>cel x[3] 删除 指定 位 置 上 的 元 素 
>>>x 

[1,1,1] 


必须 要 再 次 强调 的 是 ,由 于 列表 具有 内 存 自动 收缩 和 扩张 功能 ,在 列表 中 间 位 置 插入 
或 删除 元 素 时 ,不 仅 效率 较 低 ,该 位 置 后 面 所 有 元 素 在 列表 中 的 索引 也 会 发 生变 化 ,必须 
牢 牢记 住 这 一 点 。 

3. count( ) index( ) 


列表 方法 count( ) 用 于 返回 列表 中 指定 元 素 出 现 的 次 数 ;index( ) 用 于 返回 指定 元 素 
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在 列表 中 首次 出 现 的 位 置 ,如 果 该 元 素 不 在 列表 中 则 抛 出 异常 。 


>>>x=[1,2,2,3,3,3,4,4,4,4] 
于 素 3 在 列表 x 中 的 出 现 次 数 


>>>x.count (3) 
3 

>>>x.comt 5) 生存 在 ,返回 0 
0 

>>>x.incex C) 斌 素 2 在 列表 x 中 首次 出 现 的 索引 
二 

>>>x.index (5) 列表 x 中 没有 5, 抛 出 异常 


VBlusPrror: 5 is rot in list 

通过 前 面 的 介绍 我 们 已 经 知道 ,列表 对 象 的 很 多 方法 在 特殊 情况 下 会 抛 出 异常 ,而 一 
且 出 现 异 常 ,整个 程序 就 会 崩溃 ,这 是 我 们 不 希望 的 。 为 避免 引发 异常 而 导致 程序 崩溃 ， 
一 般 来 说 有 两 种 方法 : 使 用 选择 结构 确保 列表 中 存在 指定 元 素 再 调用 有 关 的 方法 ; 
加 使 用 异常 处 理 结构 。 下 面 的 代码 使 用 异常 处 理 结 构 保证 用 户 输入 的 是 三 位 数 ,然后 使 
用 关键 字 in 来 测试 用 户 输入 的 数字 是 否 在 列表 中 ,如 果 存 在 则 输出 其 索引 ,否则 提示 不 
存在 。 

fran randam jmport sarple 

1st =sanple (range (100,1000) ,100) 


while True: 
x=irput ("请 输入 一 个 三 位 数 : ) 
try: 
assert len(x) ==3, "长 度 必 须 为 3' 
x=int (x) 
break 
except: 
Fass 
ifx in lst: 
Print ("元 素 {0} 在 列表 中 的 索引 为 : {1}"' .fomat (x,1st.index (x))) 
else: 
Frint ("列表 中 不 存在 该 元 素 .") 


4. sort( ) .reverse( ) 
列表 对 象 的 sort( ) 方 法 用 于 按照 指定 的 规则 对 所 有 元 素 进行 排序 ,默认 规则 是 所 有 
元 素 从 小 到 大 升序 排序 ;reverse( ) 方 法 用 于 将 列表 所 有 元 素 逆序 或 翻转 ,也 就 是 第 一 个 元 
素 和 倒数 第 一 个 元 素 交 换 位 置 , 第 二 个 元 素 和 倒数 第 二 个 元 素 交 换 位 置 ,以 此 类 推 。 
>>>x ist (range (1)) 息 含 11 个 整数 的 列表 
>>>import randm 
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>>>randam. shufHe (x) 把 列表 x 中 的 元 素 随机 乱 序 


>>>x 
[6,0,1,7,4,3,2,8,5,10,9] 
>>>x-sort (ey arbda item:1en (str (item) ) ,reverse True) 
磅 转换 成 字符 串 以 后 的 长 度 降序 排列 
>>>x 
[10,6,0,1,7,4,3,2,8,5,9] 
>>>x.sort (ey =str) 碗 转换 为 字符 串 后 的 大 小 升序 排序 
>>>x 
[0,1,10,2,3,4,5,6,7,8,9] 
>>>x.sort () 过 默 认 规 则 排序 
>>>x 
[0,1,2,3,4,5,6,7,8,9,10] 
>>>x.reverse() 怒 所 有 元 素 翻 转 或 逆序 
>>>x 
[10,9,8,7,6,5,4,3,2,1,0] 


列表 对 象 的 sort( ) 和 reverse( ) 分别 对 列表 进行 原 地 排序 (in-place sorting) 和 逆序 , 没 
有 返回 值 。 所 谓 “ 原 地 ”" ,意思 是 用 处 理 后 的 数据 替换 原来 的 数据 ,列表 首 地 址 不 变 , 列 表 
中 元 素 原来 的 顺序 全 部 丢失 。 

如 果 不 想 丢 失 原 来 的 顺序 ,可 以 使 用 2.4.4 节 介绍 的 内 置 函 数 sorted ( ) 和 
reversed( ) 。 其 中 ,内 置 函 数 sorted( ) 返 回 排序 后 的 新 列表 ,参数 key 和 reverse 的 含义 与 
列表 方法 sort( ) 完全 相同 ;内 置 函 数 reversed( ) 返 回 一 个 逆序 后 的 reversed 对 象 。 充 分 利 
用 列表 对 象 的 sort( ) 方 法 和 内 置 函 数 sorted( ) 的 key 参数 ,可 以 实现 更 加 复杂 的 排序 ,以 
内 置 函数 sorted( ) 为 例 : 


>>>cPmeresul 七 =[["Bab',95.0, "R']， 

['Alan',86.0,'C'], 

[Mandy' ,83.5, 'A'], 

[Rab'v89.3, 'E']] 
>>>fram qperator inport itemgetter 
>>>sorted (gameresult., key 一 itergetter 2)) 婉 子 列表 第 3 个 元 素 进行 升序 排序 
[["Bdb',95.0, 'A'], ["Mandy',83.5, 'A'], ['Alan',86.0, 'C'], ['Rib',89.3, 'E']] 
>>>sorted (gareresult, key =itergetter CQ,0)) 伟 按 第 3 个 元 素 升序 并 排列 ,再 按 第 一 个 元 素 升序 排序 
[["Bdb',95.0, 'A'], ['Mandy',83.5, 'A'], ['Alan',86.0, 'C"], ['Rb',89.3, 'E"]] 
>>>sorted (gameresult, key =itemgetter (2,0) ,reverse =True) 
[["Reb',89.3, 'E'], ['Alan',86.0, 'C'], [Mandy',83.5, 'A'], [Bob',95.0, 'A']] 
>>>listl =["what"™, "I'm", "sorting", "by"] 页 一 个 列表 内 容 为 依据 
>>>list2 =["samething", "else "to","sort"] 时 另 一 个 列表 内 容 进 行 排序 
>>>pairs 一 ip(listl,1list2) 把 两 个 列表 中 的 对 应 位 置 元 素 配对 
>>>[item[1] for item in sorted (pairs, key lanbda x:x[0], reverse -True)] 
['samething', 'to', "sort', 'else'] 
>>>x=[[1,2,3], [2,1,4], [2,2,1]] 
>>>sorted (x, key Aanbda item: (item[1], -item[2])) 
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所 第 2 个 元 素 升序 

第 3 个 元 素 降 序 排 序 

笋 里 的 负 号 只 适用 于 数值 型 元 素 
[[2,1v4], ,2,3], [2,2,11] 
>>>x =["asaa', bc rd rb', pa] 
>>>sorted (x, key Alanbda item: (len(item ,item) 

计 按 长 度 排序 ,长度 一 样 的 正常 排序 
[bw av rba', ‘be', raaaa'] 


5. copy() 


列表 对 象 的 copy( ) 方 法 返回 列表 的 浅 复制 。 所 谓 浅 复制 ,是 指 生 成 一 个 新 的 列表 ， 
并 且 把 原 列表 中 所 有 元 素 的 引用 都 复制 到 新 列表 中 。 如 果 原 列表 中 只 包含 整数 .实数 、 复 
数 等 基本 类 型 或 元 组 .字符 串 这 样 的 不 可 变 类 型 的 数据 ,一 般 是 没有 问题 的 。 但 是 ,如 果 
原 列表 中 包含 列表 之 类 的 可 变数 据 类 型 ,由 于 浅 复制 时 只 是 把 子 列表 的 引用 复制 到 新 列 
表 中 ,于 是 修改 任何 一 个 都 会 影响 另外 一 个 。 


>>>x=[1,2, [3,4]] 娃 列 表 中 包含 子 列表 

>>>y =x.opy 0) 厂 复 制 

>>>y 两 个 列表 中 的 内 容 看 起 来 完全 一 样 
[1,2, [3,4]] 

>>>y[2] .append (5) 网 新 列表 中 的 子 列表 追加 元 素 
>>>x[0] -6 整数 .实数 等 不 可 变 类 型 不 受 此 影响 
>>>y.append (6) 首 新 列表 尾部 追加 元 素 

>>>y 

[1,2, [3,4,5],6] 

>>>x 款 列 表 不 受 影 响 


[6,2, [3,4,5]] 


列表 对 象 的 copy( ) 方 法 和 切片 操作 以 及 标准 库 copy 中 的 copy( ) 函数 一 样 都 是 返回 
浅 复 制 ,如 果 想 避免 上 面 代 码 演示 的 问题 ,可 以 使 用 标准 库 copy 中 的 deepcopy( ) 函数 实 
现 深 复制 。 所 谓 深 复制 ,是 指 对 原 列表 中 的 元 素 进 行 递 归 , 把 所 有 的 值 都 复制 到 新 列表 
中 ,对 艇 套 的 子 列表 不 再 是 复制 引用 。 这 样 一 来 ,新 列表 和 原 列表 是 互相 独立 ,修改 任何 
一 个 都 不 会 影响 另外 一 个 。 


>>>import opy 

>>>xx=[1,2, [3,4]] 

>>>Y=copy.deepoopy Co 这 复 制 

>>>x[2] .append (5) 萝 原 列表 中 的 子 列表 追加 元 素 
>>>y.append(6) 三 新 列表 尾部 追加 元 素 

>>>y 

[1,2, [3,4],6] 

>>>x 

[1,2, [3,4,5]] 
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不 论 是 浅 复制 还 是 深 复制 ,与 列表 对 象 的 直接 赋值 都 是 不 一 样 的 情况 。 下 面 的 代码 
把 同一 个 列表 赋值 给 两 个 不 同 的 变量 ,这 两 个 变量 是 互相 独立 的 ,修改 任何 一 个 都 不 会 影 
响 另 外 一 个 。 
>>>x=[1,2, [3,4]] 
>>>y=[1,2, [3,4]] 到 同一 个 列表 对 象 赋值 给 两 个 变量 
>>>x.append (5) 
>>>x[2] .append(6) 坟 改 其 中 一 个 列表 的 子 列表 
>>>x 
[1,2, [3,4,6],5] 
>>xy 环 影 响 另 外 一 个 列表 
[1,2, [3,4]] 
下 面 的 代码 演示 的 是 另外 一 种 情况 ,把 一 个 列表 变量 赋值 给 另外 一 个 变量 ,这 样 两 个 
变量 指向 同一 个 列表 对 象 ,对 其 中 一 个 做 的 任何 修改 都 会 立刻 在 另外 一 个 变量 得 到 体现 。 


>>>x=[1,2, [3,4]] 

>>>y = 布 个 变量 指向 同一 个 列表 

>>>x[2] .append(5) 

>>>x.append(6) 

>>>x[0] 37 

>>>x 

[7,2, [3,4,5],6] 

>>>y 里 x 做 的 任何 修改 ,y 都 会 受到 影响 
[7,2, [3,4,5],6] 


314 列表 对 象 支持 的 运算 符 


加 法 运算 符 ( + ) 也 可 以 实现 列表 增加 元 素 的 目的 ,但 这 个 运算 符 不 属于 原 地 操作 ， 
而 是 返回 新 列表 ,并 且 涉 及 大 量 元 素 的 复制 ,效率 非常 低 。 使 用 复合 赋值 运算 符 + = 实现 
列表 追加 元 素 时 属于 原 地 操作 ,与 append( ) 方 法 一 样 高 效 。 


>>>x=[1,2,3] 
>>>id(x) 
53868168 
>>>x = +[4] 译 接 两 个 列表 
>>>x 
[1,2,3,4] 
>>>id(x) 的 存 地 址 发 生 改 变 
53875720 
>>>x +=[5] 葛 列 表 追 加 元 素 
>>>x 
[1,2,3,4,5] 
>>>id(x) 钓 存 地 址 不 变 
53875720 
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乘法 运算 符 * 可 以 用 于 列表 和 整数 相 乘 ,表示 序列 重复 ,返回 新 列表 ,从 一 定 程 度 上 来 
说 也 可 以 实现 为 列表 增加 元 素 的 功能 。 与 加 法 运算 符 ( + ) 一 样 ,该 运算 符 也 适用 于 元 组 和 
字符 串 。 另 外 ,运算 符 * = 也 可 以 用 于 列表 元 素 重 复 ,与 运算 符 + = 一 样 属于 原 地 操作 。 


>>>x=[1,2,3,4] 

>>>id (x) 

54497224 

>>>x 坟 昌 读 素 重复 ,返回 新 列表 
>>>x 

[1,2,3,4,1,2,3,4] 

>>>id (x) 此 址 发 生 改 变 
54603912 

>>>x*=2 读 素 重复 , 原 地 进行 
>>>x 

[012,3)4,1;2,3,4,1,2,3,4,1;2,3,4] 

>>>id(x) 屯 址 不 变 

54603912 

>>>[1,2,3] 0 重复 0 次 ,清空 

0 


由 于 Python 列表 中 元 素 存储 的 是 地 址 而 不 是 值 , 当 包含 子 列表 的 列表 进行 元 素 重 复 
的 时 候 , 情 况 会 复杂 一 些 。 





>>>x=[[1]] 8 

>>>x 

[0], 01, 01] 

>>>id(x[0]) ==id [1]) ==id(x[2]) 疾 [ 列 表 x 中 的 3 个 元 素 是 同一 个 列表 对 象 
True 

>>>x[0] .append (3) 盎 其 中 一 个 子 列表 追加 新 元 素 

>>>x 已 外 两 个 子 列表 会 受到 同样 的 影响 

[O31, D31;0,311 

>>>x[0] =[1,2,3] 值 接 修改 第 一 个 元 素 的 值 

>>>x 环 影响 另外 两 个 元 素 


[[1,2,3], [1,3], [1,3]] 
>>>id(x[1]) ==id(x[2]) 


True 

>>>id(x[0]) ==id(x[01]) 钙 再 是 同一 个 对 象 
False 

不 过 ,上 面 的 描述 并 不 适用 于 下 面 的 情况 : 

>>>x=[[] for i in range (3)] 副 表 推导 式 

>>>x 

[0,0,0] 

>>>x[0] .append 1) 型 个 子 列表 互 不 影响 


>>>x[1] -spPena(3) 
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>>>x[2] -spenaG) 

>>>x 

[1], [B31, [5]] 

成 员 测 试 运算 符 in 可 用 于 测试 列表 中 是 否 包 含 某 个 元 素 ,查询 时 间 随 着 列表 长 度 的 
增加 而 线性 增加 ,而 同样 的 操作 对 于 集合 而 言 则 是 常数 级 的 。 

>>>3 in [1,2,3] 

True 

>>33 in [0,2,'3'] 

False 


315 内 置 函 数 对 列表 的 操作 


除了 列表 对 象 自身 方法 之 外 ,很 多 Python 内 置 函 数 也 可 以 对 列表 进行 操作 。 例 如 ， 
max( ) .min( ) 函数 用 于 返回 列表 中 所 有 元 素 的 最 大 值 和 最 小 值 ,sum( ) 函数 用 于 返回 列 
表 中 所 有 元 素 之 和 ,len( ) 函数 用 于 返回 列表 中 元 素 个 数 ,zip( ) 函数 用 于 将 多 个 列表 中 元 
素 重 新 组 合 为 元 组 并 返回 包含 这 些 元 组 的 zip 对 象 ,enumerate( ) 函数 返回 包含 若干 下 标 
和 值 的 近代 对 象 ,map( ) 函数 把 函数 映射 到 列表 上 的 每 个 元 素 ,filter( ) 函数 根据 指定 函数 
的 返回 值 对 列表 元 素 进行 过 滤 ,all( ) 函数 用 来 测试 列表 中 是 否 所 有 元 素 都 等 价 于 True， 
any( ) 用 来 测试 列表 中 是 否 有 等 价 于 True 的 元 素 。 另 外 ,标准 库 functools 中 的 reduce( ) 
函数 以 及 标准 库 itertools 中 的 compress( ) .groupby( ) .dropwhile( ) 等 大 量 函 数 也 可 以 对 列 


表 进 行 操作 。 这 里 重点 介绍 内 置 函数 对 列表 的 操作 ,关于 reduce( ) 函数 请 参考 第 2 章 的 
介绍 ,标准 库 itertools 的 用 法 请 参考 第 4 章 。 

>>>x ist (range (11)) 性 成 列表 

>>>inport random 

>>>random. shuffle (x) 林 乱 列表 中 元 素 的 顺序 

>>>x 

[0,6,10,9,8,7,4,5,2,1,3] 

>>>all Co) 测试 是 否 所 有 元 素 都 等 价 于 True 

False 

>>>any (x) 测试 是 否 存 在 等 价 于 True 的 元 素 

True 

>>>mex (x) 贩 回 最 大 值 

10 

>>>mex (x, key =str) 碗 指定 规则 返回 最 大 值 

9 

>>>min (x) 

0 

>>>sumCo 和 新 有 元 素 之 和 

55 


>>>len (x) 列表 元 素 个 数 
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>>>1ist (zip(x, [1] * 11)) 蚁 列表 元 素 重 新 组 合 
[0,D, (6,D), 0,D), 9,D, B,D, Cu) vv1)， GD, PD, 0D), B,D] 
>>>1ist (zip(range (1,4))) 志 ip0 函 数 也 可 以 用 于 一 个 序列 或 迭代 对 象 
[Qu ev GD] 
>>>1ist (zip(['a', 'b', 'c"'], [1,2])) 向 果 两 个 列表 不 等 长 ,以 短 的 为 准 
[('a'lD), (b',2)] 
>>>enumrerate (x) 散 举 列表 元 素 ,返回 emerate 对 象 
<enimerate cbject at 0xD0000000030A9120 > 
>>>1ist (ermerate (x)) umerate 对 象 可 以 转换 为 列表 ,元 组 ,集合 


[(0,0), (1,6), C10), 3,9), (4,8), (5,7), (6,4), (7,5), (8,2), (3,1), (10,3)] 


316 使 用 列表 模拟 向 量 运 算 


3.1.4 节 已 经 介绍 过 ,Python 列表 支持 与 整数 的 乘法 运算 ,表示 列表 元 素 进行 重复 并 
生成 新 列表 。Python 列表 不 支持 与 整数 的 加 、 减 、 除 运算 ,也 不 支持 列表 之 间 的 减 、 乘 、 除 
操作 。 列 表 之 间 的 加 法 运算 表示 列表 元 素 的 合并 ,生成 新 列表 。 

>>>[1,2,3] +[4,5,6] 
[1,2,3,4,5,6] 


然而 ,向 量 运算 经 常 涉及 这 样 的 操作 ,例如 向 量 所 有 分 量 同 时 加 \ 减 、 乘 、 除 同一 个 数 ， 
或 者 向 量 之 间 的 加 \ 减 、 乘 运算 ,Python 列表 对 象 本 身 不 支持 这 样 的 操作 ,不 过 可 以 借助 于 
内 置 函数 .列表 推导 式 和 标准 库 operator 中 的 方法 来 实现 。 如 果 需 要 更 加 丰富 和 强大 的 
向 量 或 矩阵 运算 ,可 以 借助 于 Python 扩展 库 numpy 实现 。 


>>>fram randam jmport Irancint 
>>>x=[randint (4,100) for i in rangeQ0)] 性 成 10 个 0Q100] 区 间 内 的 随机 数 





>>>x 

[46,76,47,28,5,15,57,29,9,40] 

>>>1ist mep (lanbda i: i 45,x)) 弛 有 元 素 同 时 加 5 
[51,81,52,33,10,20,62,34,14,45] 

>>>[i 5 for i inx] 辣 用 列表 推导 式 实现 同样 的 功能 


[51,81,52,33,10,20,62,34,14,45] 

>>>x=[randint (1,10) for i in range(10)] 竹 成 两 个 列表 
>>>y =[randint 4,10) for i in range (10)] 

>>>x 

,2,9,6,7,9,2,1,2,7] 

>>>y 

[8,1,9,7,1,5,8,4,1,9] 

>>>import qperator 

>>>sum tmep (cperator .ml ,x,y)) 移 量 内 积 

278 

>>>sm((i*j for ij in zip(x,y))) 千 用 内 管 函 数 计算 向 量 内 积 
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>>>1ist (rep (aqperator.acd, x, y)) 
[10,3,18,13,8,14,10,5,3,16] 
>>>1ist rep (larbda i,j: 11,x,Yy)) 
[10,3,18,13,8,14,10,5,3,16] 

>>>[i + for i,j in ziptz,y)] 
[10,3,18,13,8,14,10,5,3,16] 


机 个 等 长 的 向 量 对 应 元 素 相 加 
鞋 用 lambsa 表 达 式 实现 同样 的 功能 


番 用 列表 推导 式 实现 同样 的 功能 


317 列表 推导 式 语法 与 应 用 案例 


列表 推导 式 (list comprehension) ,也 称 为 列表 解析 式 , 可 以 使 用 非常 简洁 的 方式 对 列 
表 或 其 他 可 夫 代 对 象 的 元 素 进 行 遍历 、 过 滤 或 再 次 计算 ,快速 生成 满足 特定 需求 的 新 列 
表 , 代 码 非常 简洁 ,具有 很 强 的 可 读 性 ,是 Python 程序 开发 时 应 用 最 多 的 技术 之 一 。 
Python 的 内 部 实现 对 列表 推导 式 做 了 大 量 优化 ,可 以 保证 很 快 的 运行 速度 ,也 是 推荐 使 用 
的 一 种 技术 。 列 表 推 导 式 的 语法 形式 为 
[expressin for exprl in segnencel if conciticnl 
列表 推导 式 在 逻辑 上 等 价 于 一 个 循环 语句 ,只 是 形式 上 更 加 简洁 。 例 如 : 
>>>aList =[x* x for x in range (10)] 
相当 于 
>>>aList =[] 
>>>for x in range (10): 
aList .append (x* x) 
当然 ,如 果 不 使 用 列表 推导 式 的 话 , 也 可 以 借助 于 Python 函数 式 编程 的 特点 使 用 下 
面 的 代码 实现 同样 的 功能 。 
>>>aList =]ist (mep (lanibda x: x* x,range (10))) 
>>>aList =list (rep (lanibda x: Pow (x,2), range (10))) 
再 例如 : 
>>>freshfruit =[' banana', ' logariberry ', "Passicn fruit '] 
>>>aList =[w.strip() for w in freshfruit] 


等 价 于 下 面 的 代码 : 


>>>aList =[] 
>>>for item in freshfruit: 
alist .append (item.strip()) 
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当然 也 等 价 于 : 

>>>aList Aist wrap (larbda x: x.strip(), freshfruit)) 
或 

>>>aList Aist trep (str.strip, freshfruit)) 


大 家 应 该 听 过 一 个 故事 ,说 是 阿 凡 提 (也 有 的 说 是 阿 基 米 德 , 这 不 是 重点 ) 与 国王 比 
赛 下 棋 , 国 王 说 要 是 自己 输 了 的 话 阿 凡 提 想 要 什么 他 都 可 以 拿 得 出 来 。 阿 凡 提 说 那 就 要 
点 米 吧 ,棋盘 一 共 64 个 小 格子 ,在 第 一 个 格子 里 放 1 粒 米 , 第 二 个 格子 里 放 2 粒 米 , 第 三 
个 格子 里 放 4 粒 米 ,第 四 个 格子 里 放 8 粒 米 , 以 此 类 推 ,后 面 每 个 格子 里 的 米 都 是 前 一 个 
格子 里 的 2 倍 ,一 直 把 64 个 格子 都 放 满 。 那 么 到 底 需 要 多 少 粒 米 呢 ? 使 用 列表 推导 式 再 
结合 内 置 函数 sum( ) 就 很 容易 知道 答案 。 

>>>sum([2 *4#i for i in range (64)]) 

18446744073709551615 


按 一 斤 大 米 约 26 000 粒 计算 ,为 放 满 棋盘 ,需要 大 概 350 亿 吨 大 米 。 结 果 可 想 而 知 ， 
最 后 国王 没有 办 法 拿 出 那么 多 米 。 
接 下 来 再 通过 几 个 示例 来 进一步 展示 列表 推导 式 的 强大 功能 。 


1. 实现 榜 套 列表 的 平 铺 


>>>wec =[[1,2,3], [4,5,6], [7,8,9]] 
>>>[num for elem in vec for num in elem] 
[1,2,3,4,5,6,7,8,9] 


在 这 个 列表 推导 式 中 有 两 个 循环 ,其 中 第 一 个 循环 可 以 看 作 是 外 循环 ,执行 得 慢 ; 第 
二 个 循环 可 以 看 作 是 内 循环 ,执行 得 快 。 上 面 代码 的 执行 过 程 等 价 于 下 面 的 写法 : 


>>>wec =[[1,2,3], [4,5,6], [7,8,9]] 
>>>result =[] 

>>>for elem in vec: 

for nm in elem: 
result .append nm) 

>>>result 

[1,2,3,4,5,6,7,8,9] 
如 果 不 使 用 列表 推导 式 的 话 , 也 可 以 借助 于 标准 库 itertools 中 的 chain( ) 函数 把 子 列 

表 串 起 来 成 为 一 个 列表 。 

>>>wec=[QLv2v3], [4,5,6], [7,8,9]] 
>>>fram itertools inport chain 
>>>1ist (dain( wec)) 


[1,2,3,4,5,6,7,8,9] 


当然 ,这 里 演示 的 只 是 一 层 嵌 套 列 表 的 平 铺 ,如 果 有 多 级 嵌 套 或 者 不 同 子 列表 由 套 深 
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度 不 同 的 话 , 就 不 能 使 用 上 面 的 思路 了 。 这 时 ,可 以 使 用 函数 递归 实现 。 


Gef HatList (1st): 


result =[] 姐 放 最 终结 果 的 列表 
def nested (lst) : 半数 由 套 定义 
for item in 1st: 
if jsinstance (item, list) : 
nested (item) 婵 归 子 列表 
else: 
result.append(itew) 妨 平 化 列表 
nested (1st) 调用 嵌 套 定义 的 函数 
TEtbum result 版 回 结果 


另外 ,作为 一 个 扩充 ,下 面 的 代码 可 以 看 作 上 面 储 套 列 表 平 铺 的 一 个 逆 运 算 , 用 来 把 
一 维 列表 转换 成 包含 个子 列 表 的 伐 套 列表 ,每 个 子 列表 中 包含 ec 个 元 素 , 并 且 新 列表 恰 
好 容纳 原 列 表 中 的 所 有 元 素 。 如 果 需 要 更 加 复杂 的 数组 和 矩阵 运算 功能 ,可 以 借助 于 
Python 扩展 库 numpy。 


GEf resize (lst,r,c=71): 
"把 一 维 列表 转换 成 r 行 < 列 的 嵌 套 列表 '…" 
第 一 个 参数 必须 是 列表 ,并 且 只 包含 数字 
if not jsinstance (1st, List): 
retm must be a list' 
for item in 1st: 
if not jsinstance (item (int, float, orplex) ): 
retium must be a list of nmibers' 


第 二 个 和 第 三 个 参数 必须 是 整数 
if not (isinstance (r, int) and jsinstance (c,int)): 
retim ‘Wrong size."' 


坏 列 表 长 度 
cricinren=len(lst) 


疾 [ 的 大 小 恰好 能 够 容纳 原 列 表 中 的 所 有 元 素 
Ce 
if originrensT ! =0: 
retim ‘Wrong size.' 
c=originten //r 
else: 
if r*c !=originren: 
rebim Wrong size." 


车 用 切片 生成 新 的 幅 套 列表 
result =[] 
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for i in range(r): 
result.append (1st[i* c:i*# c+c]) 


是 回 新 列表 
TEbum result 


抽 试 
lst <list (range (20)) 
result =resize (1st,4,5) 
if type (result) =Aist: 
for row in result: 
print (row) 
else: 
print (result) 
2. 过 滤 不 符合 条 件 的 元 素 
在 列表 推导 式 中 可 以 使 用 让 子 句 对 列表 中 的 元 素 进 行 筛选 ,只 在 结果 列表 中 保留 符 
合 条 件 的 元 素 。 下 面 的 代码 可 以 列 出 当前 文件 夹 下 所 有 Python 源 文件 : 
>>>inport cs 
>>>[filename for filenaeme in o5.1istdir('.') if fileneme.endswith(('.py',' .Pyw'))] 
下 面 的 代码 用 于 从 列表 中 选择 符合 条 件 的 元 素 组 成 新 的 列表 : 
>>>eList =[ 1, -4,6,7.5, 2.3,9, -11] 
>>>[i for i in aList if i >0] 新 有 大 于 0 的 数字 
[6,7.5,9] 
再 例如 ,已 知 有 一 个 包含 一 些 同学 成 绩 的 字典 ,现在 需要 计算 所 有 成 绩 的 最 高 分 、 最 
低 分 .平均 分 ,并 查找 所 有 最 高 分 同学 ,代码 可 以 这 样 编写 : 


>>>scores ={"Zhang San": 45, "Li Si": 78,"Wang Wa": 40, "Zhou Liu": 96, 
"zhap Qi": 65, "Sman Ea": 90, "zheng Jiu": 78, "Wu Shi": 99, 


"Dong shiyi": 60} 
>>>highest -max(scores.values ()) 她 高 分 
>>>lowest =min (scores-velues ()) 最 低 分 
>>>average =sum(soores .values () ) /len (soores) 姥 均 分 
>>>highest, lowest, =veracP 
(99,40,72.33333333333333) 
>>>highestPerscn =[name for namey score in soores.items() if score=-=highest] 
>>>highestEFerscn 


[wa shi'] 
与 上 面 的 代码 功能 类 似 ,下 面 的 代码 使 用 列表 推导 式 查找 列表 中 最 大 元 素 的 所 有 位 置 : 


>>>fram ranctm inport randint 
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>>>x =[randint (1,10) for i in range (20)] 0 个 介 于 口 ,10] 的 整数 
>>>x 
[10,2,3,4,5,10,10,9,2,4,10,8,2,2,9,7,6,2,5,6] 
>>>m=max (x) 
>>> [index for index, value in emerate (x) if value ==m] 所 大 整数 的 所 有 出 现 
位 置 
[0,5,6,10] 


3. 同时 遍历 多 个 列表 或 可 迁 代 对 象 


>>>[ (x,y) for x in [1,2,3] for yin [3,1,4] if x !=y] 
[(,3),0,9, 2,3), B,D), C4), GB,1), 3,4)] 
>>>[ (x,y) for x in [1,2,3] i£f x=3 fory in [3,1,4] if y! =x] 


[0,3), 4,4)] 
对 于 包含 多 个 循环 的 列表 推导 式 ,一定 要 清楚 多 个 循环 的 执行 顺序 或 “ 肉 套 关系 ”。 


例如 ,上 面 第 一 个 列表 推导 式 等 价 于 


>>>result =[] 
>>>for x in [1,2,3]: 
for y in [3,1,4]: 
if x !=y: 
result .append ( (x,y)) 


>>>result 
[0,3),0,9, C3), CD), C4), BG,1), GB,4)] 


分 析 上 面 的 代码 和 和 运行 结果 可 以 看 出 ,这 是 两 个 序列 元 素 笛 卡 儿 积 的 一 部 分 ,作为 一 
种 技巧 ,也 可 以 使 用 下 面 的 代码 实现 同样 的 功能 。 
>>>inport itertools 
>>>1ist (itertools.product ([1,2,3], [3,1,4])) 


[0,3),0,D),0,), C3), C1), C4), B,3), (3,1), G,4)] 
>>>1ist (filter (lanbbda x:x[0] ! =x[1],itertools.product ([1,2,3], [3,1,4]))) 


[(,3), 0,9), C3), C1), C4), BG,1), BG,4)] 


4. 使 用 列表 推导 式 实 现 矩阵 转 置 


>>>mraetrix=[[1,2,3,4], [5,6,7,8], [9,10,11,12]] 
>>>[ [row[i] for row in ratrix] for i in range (4)] 
[[1,5,9], [2,6,10], [3,7,11], [4,8,12]] 


对 于 嵌 套 了 列表 推导 式 的 列表 推导 式 ,一定 要 清楚 其 执行 顺序 。 例 如 ,上 面 列表 推导 
式 的 执行 过 程 等 价 于 下 面 的 代码 


>>>metrix =[[1,2,3,4], [5,6,7,8], [9,10,11,12]] 


>>>result =[] 
>>>for i in range (en ratrix[0])) : 
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result .append ([row[i] for row in matrix]) 
>>>result 
[[1,5,9], [2,6,10], [3,7,11], [4,8,12]] 


如 果 把 内 层 的 列表 推导 式 也 展开 的 话 , 完 整 的 执行 过 程 可 以 通过 下 面 的 代码 来 模拟 : 


>>>matrix=[ [1,2,3,4], [5,6,7,8], [9,10,11,12]] 
>>>result =[] 
>>>for i in range (en tratrix[0])): 

tarp=[] 

for row in matrix: 

tenp.append (row[i]) 

result .arperd (tenp) 
>>>result 
[[1,5,9], [2,6,10], [3,7,11], [4,8,12]] 


当然 ,也 可 以 使 用 内 置 函 数 zip( ) 和 list( ) 来 实现 矩阵 转 置 : 


>>>1ist (rep (list, zip(* matrix))) 
[[1,5,9], [2,6,10], [3,7,11], [4,8,12]] 


5. 列表 推导 式 中 可 以 使 用 函数 或 复杂 表达 式 


>>>Gef ftv) : 
自作 2==0: 
TV 一 7# 吧 
else: 
VN 
retmyv 
>>>print ([f(v) forv in [2,3,4, -1] i£f v>0]) 
[4,4,16] 
>>>print ([v*;2 if WW2==0 else V+H forv in [2,3,4, 1] if v>0]) 
[4,4,16] 


6. 列表 推导 式 支持 文件 对 象 和 迭代 
>>>with aben ("C:\NEHDSetup.1og 'r') as 印 : 的 节约 篇 幅 , 略 去 输出 
结果 


print ([line for line in fp]) 


7. 使 用 列表 推导 式 生成 100 以 内 的 所 有 素数 


>>>[p for p in range @,100) if 0 not in [psd for d in range @,int (sqrt (p)) 1)]] 
[2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,67,71,73,79,83,89,97] 
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另外 ,从 Python 3. 6. x 开始 支持 在 协 程 函数 中 使 用 下 面 形 式 的 异步 列表 推导 式 , 同 样 
的 用 法 也 适用 于 字典 推导 式 和 集合 推导 式 以 及 生成 器 推导 式 。 关 于 协 程 函数 的 介绍 请 参 
考 本 书 5.8 节 和 12.3 节 的 内 容 。 


async Gef ticker (delay, to) 搂 程 函数 ,异步 生成 器 
for i in range (to) : 
yieldi 
aait asyncio.sleep (delay) 


async Gef rn(): 
result =[i async for i in ticker (1,10) if i%$2] 柚 步 列表 推导 式 
Frint (result) 


irport asyncio 
lop asyncio.get event loop() 
try: 
lop.rmn until omplete(rn()) 
finally: 
lop.close() 


最 后 ,Python 3.6.x 及 更 新 版 本 还 支持 下 面 的 用 法 ,在 列表 推导 式 和 其 他 类 型 推导 式 
中 使 用 await 表达 式 。 


irport asyncio 


async Gef half (x): 
retim x/2 


async Gef sqare (x): 
retim x* 冯 


async Gef Cube (x) : 
Tetmm X*+ 雪 


async Gef rn(): 
result =[avait 工 G) for 工 in [halfsgnarevcibe]] 
Print (result) 


op asyncio.get event loop() 
try: 

locp-nn until orplete (nO)) 
finally: 

locp-close0 


有 
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318 切片 操作 的 强大 功能 


切片 是 Python 序列 的 重要 操作 之 一 .除了 适用 于 列表 之 外 ,还 适用 于 元 组 .字符 串 、 
range 对 象 ,但 列表 的 切片 操作 具有 最 强大 的 功能 。 不 仅 可 以 使 用 切片 来 截取 列表 中 的 任 
何 部 分 返回 得 到 一 个 新 列表 ,也 可 以 通过 切片 来 修改 和 删除 列表 中 部 分 元 素 ,甚至 可 以 通 
过 切片 操作 为 列表 对 象 增加 元 素 。 

在 形式 上 ,切片 使 用 2 个 冒号 分 隔 的 3 个 数字 来 完成 。 

[start:enq:step] 
其 中 ,3 个 数字 的 含义 与 内 置 卫 数 range( start，end，step) 完全 一 致 ,第 一 个 数字 start 表示 
切片 开始 的 位 置 ,默认 为 0; 第 二 个 数字 end 表示 切片 截止 (但 不 包含 ) 的 位 置 (默认 为 列 
表 长 度 ) ;第 三 个 数字 step 表示 切片 的 步 长 (默认 为 1) 。 当 start 为 0 时 可 以 省 略 , 当 end 
为 列表 长 度 时 可 以 省 略 , 当 step 为 1 时 可 以 省 略 ,省 略 步 长 时 还 可 以 同时 省 略 最 后 一 个 冒 
号 。 另 外 , 当 step 为 负 整 数 时 ,表示 反 向 切片 ,这 时 start 应 该 在 end 的 右 侧 才 行 。 


1. 使 用 切片 获取 列表 部 分 元 素 


使 用 切片 可 以 返回 列表 中 部 分 元 素 组 成 的 新 列表 。 与 使 用 索引 作为 下 标 访问 列表 元 
素 的 方法 不 同 , 切 片 操 作 不 会 因为 下 标 越 界 而 抛 出 异常 ,而 是 简单 地 在 列表 尾部 截断 或 者 
返回 一 个 空 列表 ,代码 具有 更 强 的 健壮 性 。 


>>>aList =[3,4,5,6,7,9,11,13,15,17] 


>>>aList[::] 上 是 回 包含 原 列 表 中 所 有 元 素 的 新 列表 
[3,4,5,6,7,9,11,13,15,17] 

>>>aList[:: 1] 版 回 包含 厚 列 表 中 所 有 元 素 的 逆序 列表 
[17,15,13,11,9,7,6,5,4,3] 

>>>aList[::2] 靖 一 个 取 一 个 ,获取 偶数 位 置 的 元 素 
[3,5,7,11,15] 

>>>aList [1::2] 媚 一 个 取 一 个 ,获取 奇数 位 置 的 元 素 
[4,6,9,13,17] 

>>>aList [3:6] 糙 定 切片 的 开始 和 结束 位 置 

[6,7,9] 

>>>aList [0:100] 制 片 结束 位 置 大 于 列表 长 度 时 ,从 列表 尾部 截断 
[3,4,5,6,7,9,11,13,15,17] 

>>>aList [100] 完 出 异常 ,不 允许 越界 访问 

IndexError: list index cut of range 

>>>aList [100:] 制 片 开始 位 置 大 于 列表 长 度 时 ,返回 空 列表 
0 

>>>aList[ -15:3] 风行 必要 的 截断 处 理 

[3,4,5] 


>>>len arist) 
10 
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>>>aList [3: -10: 1] 六 和 置 3 在 位 置 20 的 右 侧 , 工 表示 反 向 切片 
[6,5,4] 
>>>aList [3: -5] 粒 置 3 在 位 置 已 的 左 侧 , 正 向 切片 
[6,7] 


2. 使 用 切片 为 列表 增加 元 素 


可 以 使 用 切片 操作 在 列表 任意 位 置 插入 新 元 素 ,不 影响 列表 对 象 的 内 存 地 址 ,属于 原 
地 操作 。 

>>>aList =[3,5,7] 

>>>aList [len (arist) :] 

0 


>>>aList [len (aList) :] =[9] 寿 列 表 尾 部 增加 元 素 
>>>aList[:0] =[1,2] 三 列表 头 部 插入 多 个 元 素 
>>>aList [3:3] =[4] 三 列表 中 间 位 置 插入 元 素 
>>>eList 

[1,2,3,4,5,7,9] 


3. 使 用 切片 替换 和 修改 列表 中 的 元 素 


>>>aList =[3,5,7,9] 
>>>aList[:3] =[1,2,3] 珊 换 列表 元 素 ,等 号 两 边 的 列表 长 度 相等 
>>>aList 

[1,2,3,9] 

>>>aList [3:] =[4,5,6] 制 片 连续 ,等 号 两 边 的 列表 长 度 可 以 不 相等 
>>>aList 

[1,2,3,4,5,6] 

>>>aList[::2] =[0] * 3 病 一 个 修改 一 个 

>>>eList 

[0,2,0,4,0,6] 

>>>aList[::2] =['a', 'b', 'c'] 贤 一 个 修改 一 个 

>>>aList 

['a's2, 'b',4, 'c',6] 

>>>aList [1::2] =range (3) 疗 列 解 包 的 用 法 

>>>aList 

['a',0, b'sl, ‘c's2] 


>>>aList [1::2] -mep (lanbda x: x! 5,range G)) 


>>>aList 
['a',True, 'b', True, 'c',True] 

>>>aList [1::2] =zip('abc', range (3)) #ep、 filter、zip 对 象 都 支持 这 样 的 用 法 
>>>aList 

['a', (‘a',0), b', (Pb',1),'c', ('c',2)] 

>>>aList[::2] =[01] 勒 片 不 连续 时 等 号 两 边 列表 的 长 度 必须 相等 


ValueRrror: attenpt to assign seqyenoe of size 1 to extended slice of size 3 
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4. 使 用 切片 删除 列表 中 的 元 素 


>>>aList =[3,5,7,9] 
>>>aList[:3] =[] 删除 列表 中 前 3 个 元 素 
>>>aList 
[9] 
另外 ,也 可 以 结合 使 用 del 命令 与 切片 结合 来 删除 列表 中 的 部 分 元 素 ,并 且 切 片 元 素 
可 以 不 连续 。 
>>>aList =[3,5,7,9,11] 
>>>0el arist[:3] 制 片 元 素 连续 
>>>aList 
[9,11] 
>>>aList =[3,5,7,9,11] 
>>>ael aList[::2] 制 片 元 素 不 连续 , 隔 一 个 删 一 个 
>>>aList 
[5,9] 


5. 切片 得 到 的 是 列表 的 浅 复制 


在 3.1.3 节 介绍 列表 对 象 的 copy( ) 方 法 时 曾经 提 到 ,切片 返回 的 是 列表 元 素 的 浅 复 
制 ,与 列表 对 象 的 直接 赋值 并 不 一 样 ,和 3.1.3 节 介 绍 的 深 复制 也 有 本 质 的 不 同 。 


>>>aList =[3,5,7] 


>>>HList =aList[::] 制 片 , 浅 复制 

>>>aList 一 -List 古 个 列表 的 值 相 等 

True 

>>>aList is bList 找 复 制 ,不 是 同一 个 对 象 

False 

>>>id(aList) ==id (onist) 三 个 列表 对 象 的 地 址 不 相等 

False 

>>>id(x[0]) ==id(y[0]) 相同 的 值 在 内 存 中 只 有 一 份 

True 

>>>bListD] -8 政 改 HList 列 表 元 素 的 值 不 会 影响 arist 
>>>HList #0ist 的 值 发 生 改变 

[3,8,7] 

>>>aList rist 的 值 没 有 发 生 改 变 

[B,5,7] 

>>>x=[[1], [2], [B31]] 贡 1 果 列表 中 包含 列表 或 其 他 可 变 序 列 
>>>y =x[:] 精 况 会 复杂 一 些 

>>>y 

[DJ], [2], [3]] 

>>>y[0] =[4] 年 接 修改 y 中 下 标 为 0 的 元 素 值 ,不 影响 x 


>>>y 


第 3 章 玄 之 又 玄 , 众 妙 之 门 : 详解 Python 序列 结构 = 





73 
KK 
[[4], [2], [31] 
>>>y[1] .append 5) 巍 过 列表 对 象 的 方法 原 地 增加 元 素 
>>>y 
[[4], [2,5], [3]] 
>>>x 列表 x 也 受到 同样 的 影响 
[[1], [2,5], [3]] 


3.2 元 组 : 轻 量 级 列表 


321 元 组 创建 与 元 素 访 问 


列表 的 功能 虽然 很 强大 ,但 负担 也 很 重 ,在 很 大 程度 上 影响 了 运行 效率 。 有 时 候 我 们 
并 不 需要 那么 多 功能 ,很 希望 能 有 个 轻 量 级 的 列表 ,元 组 (tuple) 正 是 这 样 一 种 类 型 。 在 
形式 上 ,元 组 的 所 有 元 素 放 在 一 对 圆 括号 中 ,元 素 之 间 使 用 逗号 分 隔 , 如 果 元 组 中 只 有 一 
个 元 素 则 必须 在 最 后 增加 一 个 逗号 。 


>>>x=(1,2,3) 值 接 把 元 组 赋值 给 一 个 变量 

>>>type CO 糯 用 type(0 函 数 查看 变量 类 型 

<class ‘bple' > 

>>>x[0] 斌 组 支持 使 用 下 标 访问 特定 位 置 的 元 素 
量 

>>>x[ +1] 板 后 一 个 元 素 , 元 组 支持 双向 索引 

全 

>>>x[1] 4 岷 组 是 不 可 变 的 

TypeError: ‘bple' cbject abes mot support item assigrment 

>>>x=(3) 位 和 x 氨 是 一 样 的 

>>>x 

党 

>>>x=03,) 突 ] 果 元 组 中 只 有 一 个 元 素 , 必 须 在 后 面 多 写 一 个 逗号 
>>>x 

B,) 

>>>x=() 和 俱 元 组 

>>>x ple0) 六 元 组 

>>>tuple (range (5)) 糙 其 他 迭代 对 象 转换 为 元 组 

(0,1,2,3,4) 


除了 上 面 的 方法 可 以 直接 创建 元 组 之 外 ,很 多 内 置 函数 的 返回 值 也 是 包含 了 若干 元 
组 的 可 迭代 对 象 ,例如 enumerate( ) ,zip( ) 等 。 


>>>1ist (ermerate (range (5))) 
[(0,0), ,1), C2), BG,3), (4,4)] 
>>>ist (zip (range B), 'abodefg")) 
[(0,'a), ,Pb'), C,'c')] 
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322 元 组 与 列表 的 异同 点 


列表 和 元 组 都 属于 有 序 序列 ,都 支持 使 用 双向 索引 访问 其 中 的 元 素 ,以 及 使 用 
count( ) 方 法 统计 元 素 的 出 现 次 数 和 index( ) 方 法 获取 元 素 的 索引 ,len( ) .map() filter( ) 
等 大 量 内 置 函 数 和 + 、* 、+ = \in 等 运算 符 也 都 可 以 作用 于 列表 和 元 组 。 虽 然 有 着 一 定 
的 相似 之 处 ,但 列表 和 元 组 在 本 质 上 和 内 部 实现 上 都 有 着 很 大 的 不 同 。 

元 组 属于 不 可 变 (immutable) 序列 ,不 可 以 直接 修改 元 组 中 元 素 的 值 ,也 无 法 为 元 组 
增加 或 删除 元 素 。 因 此 ,元 组 没有 提供 append( ) extend( ) 和 insert( ) 等 方法 ,无 法 向 元 
组 中 添加 元 素 ; 同样 ,元 组 也 没有 remove( ) 和 pop( ) 方 法 ,也 不 支持 对 元 组 元 素 进 行 del 
操作 ,不 能 从 元 组 中 删除 元 素 , 而 只 能 使 用 del 命令 删除 整个 元 组 。 元 组 也 支持 切片 操 
作 , 但 是 只 能 通过 切片 来 访问 元 组 中 的 元 素 ,而 不 允许 使 用 切片 来 修改 元 组 中 元 素 的 值 ， 
也 不 支持 使 用 切片 操作 来 为 元 组 增加 或 删除 元 素 。 从 一 定 程度 上 讲 , 可 以 认为 元 组 是 轻 
量 级 的 列表 ,或 者 "常量 列表 ”。 

Python 的 内 部 实现 对 元 组 做 了 大 量 优化 ,访问 速度 比 列表 更 快 。 如 果 定 义 了 一 系列 
常量 值 ,主要 用 途 仅 是 对 它们 进行 遍历 或 其 他 类 似 用 途 , 而 不 需要 对 其 元 素 进 行 任何 修 
改 , 那 么 一 般 建 议 使 用 元 组 而 不 用 列表 。 元 组 在 内 部 实现 上 不 允许 修改 其 元 素 值 ,从 而 使 
得 代码 更 加 安全 ,例如 ,调用 函数 时 使 用 元 组 传递 参数 可 以 防止 在 函数 中 修改 元 组 ,而 使 
用 列表 则 很 难保 证 这 一 点 。 

然而 ,虽然 元 组 属于 不 可 变 序列 ,其 元 素 的 值 是 不 可 改变 的 ,但 是 如 果 元 组 中 包含 可 
变 序列 ,情况 就 复杂 了 。 





>>>x=([1,2],3) 想 含 列表 的 元 组 

>>>x[0] [0] < 月 改元 组 中 的 列表 元 素 

>>>x[0] .append (8) 其 元 组 中 的 列表 增加 元 素 

>>>x 

([5,2,8],3) 

>>>x[0] =x[0] +[10] 械 图 修改 元 组 的 值 ,失败 

TypeError: ‘bple' doject does not support item assigment 

>>>x 

([5,2,8],3) 

>>>x[0] +=[10] 现 出 异常 ,但 元 组 中 的 元 素 已 被 修改 
TypeError: ‘bple' doject does not support item assigmment 

>>>x 

([5,2,8,10],3) 

>>>y =x[0] 才 和 x[0] 指 向 同一 个 列表 
>>>y+=[11] 条 过 Y 可 以 影响 元 组 x 中 的 第 一 个 列表 
>>>x 

([5,2,8,10,11],3) 

>>>y y+02] 圭 意 ,这 和 Y+=02] 是 有 本 质 区 别 的 
>>>y 


[5,2,8,10,11,12] 
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>>>x 
([5,2,8,10,111,3) 
最 后 ,作为 不 可 变 序 列 ,与 整数 .字符 串 一 样 ,元 组 可 用 作 字 典 的 键 , 也 可 以 作为 集合 
的 元 素 。 而 列表 则 永远 都 不 能 当 作 字典 键 使 用 ,也 不 能 作为 集合 中 的 元 素 , 因 为 列表 不 是 
不 可 变 的 。 内 置 函数 hash( ) 可 以 用 来 测试 一 个 对 象 是 否 可 哈 希 。 一 般 来 说 ,并 不 需要 关 
心 该 函数 的 返回 值 具体 是 什么 ,重点 是 对 象 是 否 可 喻 希 , 如 果 对 象 不 可 喻 希 会 抛 出 异常 。 


>>>hash( 0,)) 赎 组 .数字 ,字符 串 都 是 可 哈 希 的 
3430019387558 

>>>hash (3) 

3 

>>>hash('hello world. ') 

-4012655148192931880 

>>>hash([1,2]) 列表 不 可 哈 硕 

TypesError: unhashable type: 'list' 


323 生成 器 推导 式 


生成 器 推导 式 也 称 为 生成 器 表达 式 ( generator expression ) ,用 法 与 列表 推导 式 非常 相 
似 , 在 形式 上 生成 器 推导 式 使 用 圆 括 号 (parentheses ) 作为 定 界 符 , 而 不 是 列表 推导 式 所 使 
用 的 方 括号 (square brackets) 。 与 列表 推导 式 最 大 的 不 同 是 ,生成 器 推导 式 的 结果 是 一 个 
生成 器 对 象 。 生 成 器 对 象 类 似 于 迭代 器 对 象 , 具 有 惰性 求 值 的 特点 ,只 在 需要 时 生成 新 元 
素 , 比 列表 推导 式 具有 更 高 的 效率 ,空间 占用 非常 少 ,尤其 适合 大 数据 处 理 的 场合 。 

使 用 生成 器 对 象 的 元 素 时 ,可 以 将 其 转化 为 列表 或 元 组 ,也 可 以 使 用 生成 器 对 象 的 
__next_( ) 方 法 或 者 内 置 函 数 next( ) 进行 遍历 ,或 者 直接 使 用 for 循环 来 遍历 其 中 的 元 
素 。 但 是 不 管用 哪 种 形式 ,只 能 从 前 往 后 正 向 访问 其 中 的 元 素 ,没有 任何 方法 可 以 再 次 访 
问 已 访问 过 的 元 素 , 也 不 支持 使 用 下 标 访问 其 中 的 元 素 。 当 所 有 元 素 访 问 结束 以 后 ,如 果 
需要 重新 访问 其 中 的 元 素 , 必 须 重 新 创建 该 生成 器 对 象 。enumerate \filter .map ,zip 等 对 象 
也 具有 同样 的 特点 。 最 后 ,包含 yield 语句 的 函数 也 可 以 用 来 创建 生成 器 对 象 , 详 见 第 
5 章 。 





>>>g=((i 42) * 反 for i in range (10)) 李建生 成 器 对 象 

>>>g 

<GEnerator cbject <genespr >at 0xD000000003095200 > 

>>>bple (g) 将 生成 器 对 象 转换 为 元 组 
(4,9,16,25,36,49,64,81,100,121) 

>>>1ist (g) 上 太 成 器 对 象 已 遍历 结束 ,没有 元 素 了 

0 

>>>g=((i 42) *@ for i in range(10)) 重新 创建 生成 器 对 象 

>>>g. next _() 车 用 生成 器 对 象 的 __next _0 方 法 获取 元 素 
4 


>>>g. next _() 岁 取 下 一 个 元 素 
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可 

>>>next (g) 竺 用 函数 next 0 获取 生成 器 对 象 中 的 元 素 
16 

>>>g=((i +2) * 有 @ for i in range (10)) 

>>>for item in g: 车 用 循环 直接 遍历 生成 器 对 象 中 的 元 素 


Print (itewend=" ') 

49162536496481100121 

>>>x filter None, range C0)) filter 对象 也 具有 类 似 的 特点 

>>A inx 

True 

>>5 inx 

True 

>>>2 inx 环 可 再 次 访问 已 访问 过 的 元 素 

False 

>>>x ep (str, range CO)) ap 对 象 也 具有 类 似 的 特点 

>>>'0' inx 

True 

>>>'0' inx 钙 可 再 次 访问 已 访问 过 的 元 素 

False 

与 列表 推导 式 不 同 , 当 生成 器 推导 式 中 包含 多 个 for 语句 时 ,在 创建 生成 器 对 象 时 只 
对 第 一 个 for 语句 进行 检查 和 计算 ,在 调用 内 置 函 数 next( ) 或 生成 器 对 象 的 _next_() 方 
法 获取 值 的 时 候 才 会 检查 和 计算 其 他 for 语句 。 

>>>[x* y for x in range (3) for z in range (5)] 

Nemegrror: nere 'y' js mot defined 

>>>g=(x* y for x in range G) for z in range 5)) 

>>>next (g) 第 二 个 for 语 句 有 问题 , 抛 出 异常 

NEmeError: nere 'y' js not defined 


如 果 生 成 器 推导 式 作为 单 参数 函数 时 ,可 以 省 略 两 侧 的 圆 括号 。 


>>>sum(x for x in range 3)) 
3 


3.3 字典 : 反映 对 应 关系 的 映射 类 型 


字典 (dict) 是 包含 若干 “ 键 : 值 "元 素 的 无 序 可 变 序列 ,字典 中 的 每 个 元 素 包 含 用 冒号 
分 隔 开 的 “ 键 " 和 * 值 "两 部 分 ,表示 一 种 映射 或 对 应 关系 ,也 称 为 关联 数组 。 定 义 字 典 时 ， 
每 个 元 素 的 “ 键 " 和 * 值 "之 间 用 冒号 分 隔 ,不 同 元 素 之 间 用 逗号 分 隔 , 所 有 的 元 素 放 在 一 
对 大 括号 “1 "中 < 

字典 中 元 素 的 “ 键 " 可 以 是 Python 中 任意 不 可 变数 据 , 例 如 整数 .实数 .复数 .字符 串 、 
元 组 等 类 型 等 可 哈 希 数据 ,但 不 能 使 用 列表 、 集 合 . 字 典 或 其 他 可 变 类 型 作为 字典 的 
“ 键 "。 另 外 ,字典 中 的 “ 键 "不 允许 重复 .“ 值 "是 可 以 重复 的 。 字 典 在 内 部 维护 的 哈 希 表 
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使 得 检索 操作 非常 快 。 使 用 内 置 字典 类 型 dict 时 不 要 太 在 乎 元 素 的 先后 顺序 ,如 果 确 实 
在 乎 元 素 顺序 可 以 使 用 collections 的 OrderedDict 类 。 值 得 一 提 的 是 ,在 Python 3.6 中 又 
对 内 置 类 型 dict 进行 了 优化 , 比 Python 3.5.x 大概 能 节约 20% ~25% 的 内 存 空间 。 


331 字典 创建 与 删除 

使 用 赋值 运算 符 ”= "将 一 个 字典 赋值 给 一 个 变量 即 可 创建 一 个 字典 变量 。 
>>>aDict ={'server': 'db.diveintopython3.org', 'catabase': mysql '} 

也 可 以 使 用 内 置 类 dict 以 不 同形 式 创建 字典 ,在 第 2 章 曾经 介绍 过 这 种 用 法 ,实际 上 

是 调用 了 dict 类 的 构造 方法 。 

>>>x=dict () 剑 字 典 

>>>x={} 剑 字 典 

>>>keys =['a', b', 'c', 'd'] 

>>>walues =[1,2,3,4] 

>>>dicticnary =dict (zip (eys, values) ) 根据 已 有 数据 创建 字典 
>>>d dict name ='Dong' ,age 39) 各 L 关 键 参 数 的 形式 创建 字典 
>>>aDict =dict.framkeys (["namre' 'age', 'sex']) 

可 L 给 定 内 容 为 * 键 ” 
覃 建 “ 值 ” 为 空 的 字典 

>>>aDict 

{'name': None, 'age': None, 'sex': None} 

另外 ,Python 还 支持 使 用 字典 推导 式 快 速生 成 符合 特定 条 件 的 字典 。 
>>>{i:str(i) for i in range (1,5)} 

{1: 1',2: '2',3: '3',4: '4'} 

>>>x =['A', 'B', 'C', 'D'] 

>>>y=[rav b', Pb', 'd'] 

>>>{i:j for i,j in ziptx,y)} 

fa avrcr "pvB' Pb', 'D': ad 


与 其 他 类 型 的 对 象 一 样 , 当 不 再 需要 时 ,可 以 直接 删除 字典 ,不 再 歼 述 。 


332 字典 元 素 的 访问 


字典 中 的 每 个 元 素 表 示 一 种 映射 关系 或 对 应 关系 ,根据 提供 的 “ 键 " 作 为 下 标 可 以 访 
问 对 应 的 “ 值 ” ,如 果 字 典 中 不 存在 这 个 “ 键 "会 抛 出 异常 。 


>>>aDict ={'age': 39, 'score': [98,97], name': ‘Dang', 'sex': male'} 


>>>aDict['age'] 糙 定 的 “ 键 " 存 在 ,返回 对 应 的 “ 值 ” 
3 
>>>aDict ['adtiress'] 看 定 的 “ 键 "不 存在 , 抛 出 异常 


FeyError: 'actiress" 
为 了 避免 程序 运行 时 引发 异常 而 导致 崩溃 ,在 使 用 下 标的 方式 访问 字典 元 素 时 ,最 好 
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/A 


配合 条 件 判断 或 者 异常 处 理 结构 。 


>>>aDict ={'age': 39, "score': [98,97], "name': 'Dong' 'sex': male'} 

>>>if ‘Pge' in apict: 首先 判断 宇 典 中 是 否 存在 指定 的 * 键 ” 
Frint (apict ['zge']) 

else: 
Erint ("Not Exists.') 


Not Exists. 
>>>try: 车 用 异常 处 理 结构 
Print (apict['actiress']) 
ECEPE: 
Print ("Not Exists. 


Not Exists. 


字典 对 象 提供 了 一 个 get( ) 方 法 用 来 返回 指定 “ 键 " 对 应 的 “ 值 " ,并 且 人 允许 指定 该 键 


不 存在 时 返回 特定 的 “ 值 ” 。 例 如 : 


元 素 


>>>aDict .get ('age') 妆 ! 果 字典 中 存在 该 * 键 " 则 返回 对 应 的 * 值 ” 
39 

>>>aDict .get (actiress' "Nt Exdists.') 上 贱 定 的 “ 键 " 不 存在 时 返回 指定 的 默认 值 
>>>inport string 


>>>inport randem 

>>>x =string.ascii letters +string.digits 

>>>z ="'' .join( (rancbom.dhoice (x) for i in range (1000))) 几 成 1000 个 随机 字符 
>>>d=dict() 


>>>for ch in z: 毁 历 字符 串 , 统 计 频次 
qd[ch] 二 il.get (ch,0) 世 

>>>for Jov in sorted(d.items ()): 性 看 统计 结果 
Print (k, ':',v) 


字典 对 象 的 setdefault( ) 方 法 用 于 返回 指定 “ 键 " 对 应 的 “ 值 ” ,如 果 字 典 中 不 存在 该 


" ,就 添加 一 个 新 元 素 并 设置 该 * 键 "对 应 的 “ 值 ” (默认 为 None)。 
>>>aDict .setdefault ('actiress' 'SDIET') 碰 加 新 元 素 

saram 

>>>aDict 


{'age': 39, 'soore': [98,97], name': "Dong' actiness': "SDIET' 'sex': male'} 
对 字典 对 象 直接 进行 迭代 或 者 遍历 时 默认 是 遍历 字典 的 “ 键 ” ,如 果 需 要 遍历 字典 的 
必须 使 用 字典 对 象 的 items( ) 方法 明确 说 明 ,如 果 需 要 遍历 字典 的 “ 值 " 则 必须 使 用 


字典 对 象 的 values ( ) 方法 明确 说 明 。 当 使 用 len() .max() 、min()、sum() 、sorted()、 
enumerate( ) .map( ) \filter( ) 等 内 置 函 数 以 及 成 员 测 试 运 算 符 in 对 字典 对 象 进行 操作 时 ， 
也 遵循 同样 的 约定 。 
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>>>aDict ={'age': 39, "score': [98,97], "name': "Dong' 'sex': male'} 

>>>for item in apict: 点 认 遍历 字典 的 “ 键 ” 
Frint (item,end=" ') 

age soore nane sex 

>>>for item in aDict.items (): 盔 确 指定 遍历 字典 的 元 素 
Print (item,end=" ') 

("age',39) ("score' [98,97]) (‘name', "Dong’) ('sex', male') 

>>>aDict .items () 

dict items([('age',37), ('soore', [98,97]), (‘name', 'Dong'), ('sex', rale')]) 

>>>aDict .keys () 

dict keys(['age', 'score' "name' 'sex']) 

>>>aDict .values () 

iict values([37, [98,97], 'Dong', male']) 


333 元 素 的 添加 、 修 改 与 删除 

当 以 指定 “ 键 "为 下 标 为 字典 元 素 赋 值 时 ,有 两 种 含义 : 车 该 * 键 "存在 , 则 表示 修 
改 该 键 "对 应 的 值 ; 四 若 不 存在 , 则 表示 添加 一 个 新 的 * 键 : 值 "对 ,也 就 是 添加 一 个 新 
元 素 。 


>>>aDict ={'age': 35, "nare': 'Dong' 'sex': male'} 


>>>aDict['age'] -9 桥 改 元 素 值 
>>>aDict ['actiress'] ='SDIET" 麻 加 新 元 素 
>>>aDict 桔 用 字典 时 并 不 需要 太 在 意 元 素 顺序 


{'age': 39, "actiress': 'SDIET' nane': 'Dong','sex': male'} 

使 用 字典 对 象 的 update( ) 方 法 可 以 将 男 一 个 字典 的 * 键 : 值 "一 次 性 全 部 添加 到 当前 
字典 对 象 ,如 果 两 个 字典 中 存在 相同 的 “ 键 ”, 则 以 另 一 个 字典 中 的 “ 值 "为 准 对 当前 字典 
进行 更 新 。 

>>>aDict ={"'age': 37, 'soore': [98,97], 'name': "Dong' 'sex': male'} 

>>>aDict .update ({'a' :97, 'age' :39}) 璇 改 'aqe' 键 的 值 ,同时 添加 新 元 素 'a':97 
>>>aDict 

{'soore': [98,97],'sex': male','a': 97,'age': 39, ,name': 'Dong'} 

字典 对 象 的 setdefault( ) 方 法 也 可 以 用 来 为 字典 添加 新 元 素 ,3. 3.2 节 中 已 经 介绍 了 

该 方法 的 用 法 。 如 果 需 要 删除 字典 中 指定 的 元 素 , 可 以 使 用 del 命令 。 
>>>Gel apict['age'] 删除 字典 元 素 
>>>aDict 
frsoore': [98,97],'sex': male','a': 97, name': ‘Dang'} 
字典 对 象 的 pop( ) 和 popitem( ) 方法 可 以 弹出 并 删除 指定 的 元 素 。 


>>>aDict ={"'age': 37, score': [98,97], name': "Dong' 'sex': male'} 
>>>aDict .popitem() 群 出 一 个 元 素 ,对 空 字典 会 抛 出 异常 
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yr > py 


a 
('age',37) 得 Python 3.6.X 中 结果 略 有 不 同 , 是 正常 的 
>>>aDict .pap ('sex') 群 出 指定 键 对 应 的 元 素 
Gi 
>>>aDict 


{"'score': [98,97], name': ‘Dong'} 
字典 对 象 的 clear( ) 方 法 用 于 清空 字典 对 象 中 的 所 有 元 素 ;copy( ) 方 法 返回 字典 对 象 
的 浅 复制 ,关于 浅 复制 的 介绍 请 参考 3. 1.3 节 的 介绍 。 


334 标准 库 odledions 中 与 字典 有 关 的 类 


Python 标准 库 中 提供 了 很 多 扩展 功能 .大 幅度 提高 了 开发 效率 。 这 里 主要 介绍 
collections 中 OrderedDict 类 .defaultdict 类 和 Counter 类 ,deque ,namedtuple 以 及 其 他 更 多 
的 类 将 在 后 面 章节 中 进行 介绍 。 

1. OrderedDict 类 

Python 内 置 字典 dict 是 无 序 的 ,如 果 需 要 一 个 可 以 记 住 元 素 插 入 顺序 的 字典 ,可 以 使 
用 collections. OrderedDict。 

>>>inport collecticns 

>>xx=collecticns.Orderecpict () 峻 序 字典 
>>>x['"a'] 了 

>>>x['b'] 起 

>>>x['c'] -6 


>>>x 
OrderedDict ([('a',3), ('b',5), ('c',8)]) 


2. defaultdict 类 


前 面 3.3.2 节 中 字母 出 现 频次 统计 的 问题 ,也 可 以 使 用 collections 模块 的 defaultdict 
类 来 实现 。 


>>>inport string 

>>>import randm 

>>>x =string.ascii letters +string.digits +string.Puanctoaticn 
>>>z ="" .join( [randam. doioe (x) for i in range (1000)]) 

>>>fram collecticns import defantdict 

>>>freqnences -defaultdict (int) 新 有 值 默认 为 0 
>>>frequences 
Gefeultdict (<class 'int' >, {}) 

>>>for item in z: 

frequnences [item] + 习 米 改 每 个 字符 的 频次 

>>>frecunences.jitems () 


创建 defaultdict 对 象 时 ,传递 的 参数 表示 字典 中 值 的 类 型 ,除了 上 面 代码 演示 的 int 
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类 型 ,还 可 以 是 任意 合法 的 Python 类 型 。 


>>>fram collecticns import Gefamltcict 
>>>gemes -efeanltciict (List) 芋 用 list 作 为 值 类 型 
>>>ganes 新 有 值 默认 为 空 列表 
GEfemtdict(<class 'list' >,{}) 

>>>gamres['name'] .append('dong') 而 直 接 为 字典 gares 添加 元 素 
>>>geames[meame'] .append ('zhang') 

>>>gares["'soore'] .appernd (90) 

>>>genes['score'] .append (93) 

>>>ganes 


cefaultdict (<class "list' >, {'scoore': [90,93], nare': [rdong' zhang']}) 

3. Counter 类 

对 于 频次 统计 的 问题 ,使 用 collections 模块 的 Counter 类 可 以 更 加 快速 地 实现 这 个 功 
能 ,并 且 能 够 提供 更 多 的 功能 ,例如 ,查找 出 现 次 数 最 多 的 元 素 。 


>>>fran collecticns inport Counter 


>>>freqnences =Counber (z) 位 里 的 z 还 是 前 面 代 码 中 的 字符 串 对 象 
>>>freqhenoes .items () 

>>>frecqnences.mcst_cormcn (1) 版 回 出 现 次 数 最 多 的 一 个 字符 及 其 频率 
>>>freqnences .most_comcn (3) 帕 回 出 现 次 数 最 多 的 前 3 个 字符 及 其 频率 


3.4 集合 : 元素 之 间 不 允许 重复 


集合 (set) 属于 Python 无 序 可 变 序列 ,使 用 一 对 大 括号 作为 定 界 符 ,元素 之 间 使 用 去 
号 分 隔 , 同 一 个 集合 内 的 每 个 元 素 都 是 唯一 的 ,元 素 之 间 不 允许 重复 。 

集合 中 只 能 包含 数字 .字符 串 .元 组 等 不 可 变 类 型 (或 者 说 可 哈 希 ) 的 数据 ,而 不 能 包 
含 列表 .字典 .集合 等 可 变 类 型 的 数据 。Python 提供 了 一 个 内 置 函 数 hash( ) 来 计算 对 象 
的 哈 希 值 ,凡是 无 法 计算 哈 希 值 (调用 内 置 函 数 hash( ) 时 抛 出 异常 ) 的 对 象 都 不 能 作为 集 
合 的 元 素 , 也 不 能 作为 字典 对 象 的 * 键 ”。 


341 集合 对 象 的 创建 与 删除 
直接 将 集合 赋值 给 变量 即 可 创建 一 个 集合 对 象 。 


>>>a={3,5} 利 建 集合 对 象 
>>>type (a) 得 看 对 象 类 型 
<class 'set' > 


也 可 以 使 用 set( ) 函数 将 列表 、 元 组 、 字 符 串 ,range 对 象 等 其 他 可 和 迭代 对 象 转换 为 集 
合 , 如 果 原 来 的 数据 中 存在 重复 元 素 , 则 在 转换 为 集合 的 时 候 只 保留 一 个 ;如 果 原 序列 或 
迭代 对 象 中 有 不 可 哈 希 的 值 ,无 法 转换 成 为 集合 , 抛 出 异常 。 
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>>>a set =set (range (8,14)) 把 range 对 象 转换 为 集合 

>>>a_set 

{8,9,10,11,12,13} 

>>>b set =set ([0,1,2,3,0,1,2,3,7,8]) 艇 换 时 自动 去 掉 重复 元 素 

>>>b set 

{0,1,2,3,7,8} 

>>>x =set (0) 症 集 合 

除了 列表 推导 式 .生成 器 推导 式 .字典 推导 式 之 外 ,Python 还 支持 使 用 集合 推导 式 来 
快速 生成 集合 。 

>>>{x.strip() forxin (he rshe ，… I')} 

{'I','she', he'} 

>>>import randm 

>>>x ={randam. randint (1,500) for i in range (100)} 

弦 成 随机 数 ,自动 去 除 重复 元 素 

>>>len (x) #- 般 而 言 输出 结果 会 小 于 100 

>>>{str (x) for x in range (10)} 

{3 0 1 18, 4, 7 5 16, 191, 121} 


当 不 再 使 用 某 个 集合 时 ,可 以 使 用 del 命令 删除 整个 集合 。 
342 集合 操作 与 运算 


1. 集合 元 素 增加 与 删除 


集合 对 象 的 add( ) 方 法 可 以 增加 新 元 素 ,如 果 该 元 素 已 存在 则 忽略 该 操作 ,不 会 抛 出 
异常 ;update( ) 方 法 合并 另外 一 个 集合 中 的 元 素 到 当前 集合 中 ,并 自动 去 除 重复 元 素 。 


>>>s ={1,2,3} 


>>>s.acdB) 话 加 元 素 ,重复 元 素 自动 忽略 
>>>s.update ({3,4}) 重新 当前 字典 ,自动 忽略 重复 的 元 素 
>>>S 

{1,2,3,4} 


集合 对 象 的 pop( ) 方 法 随机 删除 并 返回 集合 中 的 一 个 元 素 , 如 果 集 合 为 空 则 抛 出 异 
常 iremove( ) 方 法 删除 集合 中 的 元 素 ,如 果 指 定 元 素 不 存在 则 抛 出 异常 ;discard( ) 方 法 从 
集合 中 删除 一 个 特定 元 素 ,如 果 元 素 不 在 集合 中 则 忽略 该 操作 ;clear( ) 方 法 清空 集合 。 


>>>s.discard(5) 制 除 元 素 , 不 存在 则 忽略 该 操作 
>>>5.remwe G) 删除 元 素 ,不 存在 就 抛 出 异常 
FeyError: 5 

>>>s.Pop0 删除 并 返回 一 个 元 素 

1 

2. 集合 运算 


内 置 函 数 len( ) .max( ) .min( ) .sum( ) .sorted( ) .map( ) ,filter( ) .enumerate( ) 等 也 适 
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CK 
用 于 集合 。 另 外 ,Python 集合 还 支持 数学 意义 上 的 交集 .并 集 . 差 集 等 运算 。 


>>>a_set =set ([8,9,10,11,12,13]) 
>>>b_ set ={0,1,2,3,7,8} 


>>>a set |b set 话 集 
{0,1,2,3,7,8,9,10,11,12,13} 

>>>a_set.unicn ( set) 放 集 
{0,1,2,3,7,8,9,10,11,12,13} 

>>>a_set gb set 婉 集 
{8} 

>>>a_set.intersecticn (> set) 攀 集 
{8} 

>>>a_set.difference (> set) 峰 集 
{9,10,11,12,13} 

>>>a set -pb set 

{9,10,11,12,13} 

>>>a_set.symetric difference (Po set) 寻 称 差 集 


{0,1,2,3,7,9,10,11,12,13} 

>>>a set ^b set 

{0,1,2,3,7,9,10,11,12,13} 

>>>x ={1,2,3} 

>>>y={1,2,5} 

>>>z ={1,2,3,4} 

>>>x<y 此 较 集合 大 小 /包含 关系 


>>>x < 之 什 子 集 


>>>y < 之 
False 
>>>{1,2,3} <={1,2,3} 村 集 
Toan 

>>>x.issubset (y) 测试 是 否 为 子 集 
False 
>>>x.isstbset (z) 
True 

>>>{3} & {4} 
set0 
>>>{3} .isdisjoint ({4}) 妆 果 两 个 集合 的 交集 为 空 , 返 回 True 
True 


需要 注意 的 是 ,关系 运算 符 >、> =、<、< = 作用 于 集合 时 表示 集合 之 间 的 包含 关 
系 ,而 不 是 比较 集合 中 元 素 的 大 小 关系 。 对 于 两 个 集合 A 和 B, 如 果 A <B 不 成 立 , 不 代 
表 A > =B 就 一 定 成 立 。 
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343 不 可 变 集合 frqenset 


Python 内 置 支持 frozenset 类 ,用 法 与 set 类 基本 相似 ,支持 交集 、 并 集 、 差 集 等 运算 以 
及 测试 是 否 为 子 集 或 超 集 等 运算 。 与 set 类 不 同 的 是 ,frozenset 是 不 可 变 集合 ,没有 提供 
add( ) .remove( ) 等 可 以 修改 集合 对 象 的 方法 。 


>>>x =frozenset (range (5)) 谢 | 建 不 可 变 集合 
>>>x 

frozenset ({0,1,2,3,4)) 

>>>x.add 5) 环 支 持 aad0 方 法 , 抛 出 异常 
Attributerrror: 'frozenset' doject has np attripute 'add' 

>>>x | frozenset (range (5,10)) 妊 集 运算 
frozenset ({0,1,2,3,4,5,6,7,8,9}) 

>>>x & frozenset (range (5,10)) 网 集运 算 
frozenset () 

>>>x -frozenset (range (5,10)) 峰 集 运算 
frozenset ({0,1,2,3,4}) 

>>>frozenset (range (4) ) <frozenset (range (5)) 系 合 包含 关系 比较 
True 


344 集合 应 用 案例 


The Zen of Python 认为 There should be one 一 and preferably only one 一 obvious way to do 
it。 编 写 代 码 时 除了 要 准确 地 实现 功能 之 外 ,还 要 考虑 代码 的 优化 ,尽量 找到 一 种 更 快 、 
更 好 的 方法 实现 预定 功能 。Python 字典 和 集合 都 使 用 hash 表 来 存储 元 素 ,元 素 查 找 速度 
非常 快 ,关键 字 in 作用 于 字典 和 集合 时 比 作用 于 列表 要 快 得 多 。 

inport ranccm 

import time 


1 Jist (range (10000)) 

2 ple (range (10000)) 

23 -et (range (10000)) 

x4 =dict (zip (range (1.0000) ,range (10000))) 
Ir =randam. randint (0,9999) 


fort in (x4,23,22,71): 
start time.time () 
for i in range (9999999) : 
rint 


Print (type (t) , "time used: ', time.time ( -start) 


从 下 面 的 运行 结果 可 以 看 出 ,对 于 成 员 测 试 运算 符 in, 列 表 的 效率 远 远 不 如 字典 和 集 
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合 , 并 且 随 着 序列 的 变 长 ,列表 的 查找 速度 越 来 越 慢 ,而 字典 和 集合 基本 上 不 受 影响 。 
<class 'dict' >time used: 1.1570661067962646 
<class 'set"' >time used: 1.442082405090332 
<class 'bple' >time used: 1185.4768052101135 
<class 'list' >time used: 1183.18967461586 
作为 集合 的 具体 应 用 ,可 以 使 用 集合 快速 提取 序列 中 单一 元 素 , 即 提取 出 序列 中 所 有 
不 重复 的 元 素 。 如 果 使 用 传统 方式 的 话 , 需 要 编写 下 面 的 代码 : 
>>>inport Iancom 
尾 成 100 个 介 于 0~ 9999 之 间 的 随机 数 
>>>listFancom=[rancom.choice (range (10000)) for i in range (100)] 
>>>ncRepeat =[] 
>>>for i in listrandom : 
if i not in ncRepeat : 
cPepeat..append (i) 
而 如 果 使 用 集合 的 话 , 只 需要 下 面 这 么 一 行 代 码 就 可 以 了 。 
>>>newSet =set (listRandoam) 
集合 中 的 元 素 不 允许 重复 ,Python 集合 的 内 部 实现 为 此 做 了 大 量 相应 的 优化 ,添加 元 
素 时 如 果 已 经 存在 则 自动 忽略 。 下 面 的 代码 用 于 返回 指定 范围 内 一 定数 量 的 不 重复 
数字 。 
jimport ranccom 
GEf ranccnNmnibers (nmiber, start,end) : 
"使 用 集合 来 生成 nmiber 个 介 于 start 和 ema 之 间 的 不 重复 随机 数 '… 


当然 ,如 果 在 项 目 中 需要 这 样 一 个 功能 的 时 候 , 还 是 直接 使 用 random 模块 的 
sample( ) 子 数 更 好 一 些 。 但 random 模块 的 sample( ) 函数 只 支持 列表 .元 组 .集合 .字符 串 
和 range 对 象 , 不 支持 字典 以 及 map .zip .enumerate \filter 等 惰性 求 值 的 迭代 对 象 。 

>>>import rancom 

>>>randam.sanple (range (1000) ,20) 着 指 定 分 布 中 选取 不 重复 元 素 

[61,538,873,815,708,609,995,64,7,719,922,859,807,464,789,651,31,702,504,25] 


下 面 的 两 段 代 码 用 来 测试 指定 列表 中 是 否 包含 非法 数据 ,很 明显 第 二 段 使 用 集合 的 
代码 更 高 效 一 些 。 


jimport rancbm 
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S 


lstoolor =("'red', 'green', "blue') 
Plors=[randam.dhoice (stcolor) for i in range (10000)] 


for item in colors: 好 历 列表 中 的 元 素 并 逐个 判断 
if item not in lstcolor: 
Print (errorsv item) 
Jreak 
证 (set (colors) -set Qstcolor)): 航 换 为 集合 之 后 再 比较 
Print ('error') 
下 面 的 代码 使 用 字典 和 集合 模拟 了 有 向 图 结构 ,并 实现 了 节点 的 人 度 和 出 度 计算 , 代 
码 中 所 用 的 有 向 图 如 图 3-3 所 示 。 
GeEf getDegmees (orientecGrach,noae) : 
utDegree =len (orienteaGsrach.get (node, [])) 
inpegree =s.m(] for v in orientedsraph.values () if node in Vv) 
TIetum (inDegree, outDegree) 
Gach={"a' :set (Podef'), 'b':set ('oe'), 'c':set ('d'), 'd':set ('e'), 'e':set ('f£'), 
'f':set (‘ogh'),'g':set ('fhi'), 'h':set ('foi'), 'i':set()} 


Print (getDegrees (graph 'h')) 


























图 3-3 有 向 图 结构 


3.5 序列 解 包 的 多 种 形式 和 用 法 


序列 解 包 (Sequence Unpacking) 是 Python 中 非常 重要 和 常用 的 一 个 功能 ,可 以 使 用 
非常 简洁 的 形式 完成 复杂 的 功能 ,提高 了 代码 的 可 读 性 ,减少 了 程序 员 的 代码 输入 量 。 


>>>xryrz 卫 /273 上 瑚 个 变量 同时 赋值 

>>> tiple =(False,3.5, 'ep') 

>>> Covyrz) 一 bple 

>>>%y,2 ~ bple 

>>>%,y,z range G) 着 以 对 range 对 象 进行 序列 解 包 
>>>x,y,z =iter ([1,2,3]) 千 用 办 代 器 对 象 进行 序列 解 包 
>>>%x,y,z mep (str, range (3)) 硅 用 可 和 迭代 的 mm 对 象 进行 序列 解 包 
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>>>a,b ,a 妊 换 两 个 变量 的 值 


序列 解 包 还 可 以 用 于 列表 字典 .enumerate 对 象 ,filter 对象 .zip 对象 等 。 对 字典 使 用 
时 ,默认 是 对 字典 * 键 "进行 操作 ,如 果 对 ”* 键 : 值 " 对 进行 操作 应 使 用 字典 的 items( ) 方 法 
说 明 ,如 果 需 要 对 字典 * 值 " 进行 操作 应 使 用 字典 的 values( ) 方 法 明确 指定 。 


>>>a=[1,2,3] 
>>>p,c'da 列表 也 支持 序列 解 包 的 用 法 

>>>x,y,2 =sorted ([1,3,2]) orted0) 函 数 返 回 排序 后 的 列表 

>>>s={'a':l b':2, 'c':3} 

>>>b,c,d=5.iteams () 化 里 的 重点 是 序列 解 包 的 用 法 

>>>p 

('c',3) 

>>>p,c,d=s 苇 用 字典 时 不 用 太 多 考虑 元 素 的 顺序 

>>>p 症 Python 3.6.x 和 更 新 版 本 中 略 有 不 同 是 正常 的 
‘ee 

>>>b,c,d =5.values() 

>>>Print (b,c,) 

主 32 

>>>a,b,c ="'AEC' 疗 符 串 也 支持 序列 解 包 

>>>print (a,b,c) 

ABC 


使 用 序列 解 包 可 以 很 方便 地 同时 遍历 多 个 序列 。 





>>>walues =[1,2,3,4] 
>>>for k,v in zip(keys,values): 
Print ((k,v) ,end=" ') 
(‘a'l) (Yb',2) (cv3) (dv4) 
>>>x=['a', ‘b','c'] 
>>>for i,v in emerate (x) : 
Print ("The value cn Positicn {0} is {1}'.fomat (i,v)) 
The value m Positicn 0 is a 
The value cn positicn 1 is b 
The value cn Positicn 2 isc 
>>>s ={"'a':l, 'b':2, 'c':3} 
>>>for kv in s.itars 0 : 疗 典 中 每 个 元 素 包含 " 键 " 和 * 值 ”两 部 分 
Print ((k,v) ,end=" ') 
(al) (Yb',2) ('c',3) 


下 面 的 代码 演示 了 序列 解 包 的 另类 用 法 和 错误 的 用 法 : 


>>>print (#01,2,3],4, *5,6)) 
123456 
>>>*range (4) ,4 
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(0,1,2,3,4) 

>>> :range (4) 

SyntaxError: can't use starred eqpression here 
>>>{ range (4) ,4, *(5,6,7)} 

{0,1,2,3,4,5,6,7} 

>>>{"'x"': 1, **{"'y': 2}} 

TY 2, 'x": 1} 

>>>a,b,c range 3) 

>>>a,b,c =*range (3) 

SyntaxError: can't Use starred eqpressian here 
>>>a,b,c,d=*range (3),3 


猎人 允许 这 样 用 


本 允许 这 样 用 


下 面 的 代码 看 起 来 与 序列 解 包 类 似 , 但 严格 来 说 是 序列 解 包 的 逆 运 算 ,与 函数 的 可 变 
长 度 参 数 一 样 ( 详 见 5.2.4 节 ) ,用 来 收集 等 号 右 侧 的 多 个 数值 。 


>>>a PD,c3,2,3,4,5 
>>>a,b,c 

(1 [2,3,4],5) 

>>2p 

[2,3,4] 

>>>a, PP,cI,2,3,4 
>>>a,b,c 

(1, [2,3],4) 

>>>a, Pb,c =ple (range (20)) 
>>>b 
[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18] 
>>> 也 本 ,2,3v4 


粹 号 左 侧 必须 为 列表 元 组 或 多 个 变量 


SyntaxError: starred assignment target rust be in a list or bple 


3.6 标准 库 中 的 其 他 常用 数据 类 型 


除了 大 量 内 置 数据 类 型 ,Python 还 通过 collections ,enum ,array .heapq ,fractions 等 标准 


库 提供 了 其 他 丰富 的 类 型 。 
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枚 举 类 型 


>>>fram enum import Em 
>>>class Color (Em : 
Ted 本 
be 
grean3 
>>>Cplor.redq 
<Color.red: 1> 
>>>type (color.green) 


时 入 模块 中 的 类 
着 建 自 定 义 枚 举 类 


芒 问 枚 举 类 的 成 员 


壮 看 枚 举 类 成 员 的 类 型 
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<Emm "Color' > 
>>>isinstance (Color.red, Color) 
True 
>>xx=dict0 
>>xx[color.reqd] ="'red' 教 举 类 成 员 可 哈 希 ,可 以 作为 字典 的 “ 键 ” 
>>>x 
{ <Color.red: 1 >: 'red'} 
>>>Color C) 版 回 指 定 值 对 应 的 枚 举 类 成 员 
<color.blue: 2> 
>>>color['red'] 
<Cblor.red: 1> 
>>>r =Color.red 
>>>r .nene 
i 
>>>r.value 
i 
>>>1ist (Color) 禾 举 类 是 可 以 选 代 的 
[<color.red: 1 > <color.blue: 2 >, <Color.green: 3>] 


362 数组 类 型 


标准 库 array 提供 的 array 类 支持 数组 的 创建 与 使 用 ,可 以 创建 的 数组 类 型 包括 整数 、 
实数 .Unicode 字符 等 ,可 以 使 用 help( ) 函数 查看 更 完整 的 类 型 列表 。 


>>>fram array inport array 

>>>5 ="Hello world" 

>>>sa =array ('u',s) 创建 可 变 字符 串 对 象 
>>>print (sa) 

array ('u', 'Hello world') 

>>>print (sa.tostring()) 栓 看 可 变 字符 串 对 象 内 容 
P'HNxDOOe VDO01 001 VD0o VD00 DO0w DO0o DOr vD01NYOodND0' 

>>>print (sa.tounicode 0) 舍 看 可 变 字 符 串 对 象 内 容 
Hello world 

>>>sa[0] ="F' 米 改 指定 位 置 上 的 字符 
>>>print (sa) 
array ('u', 'Fello world') 

>>>sa.insert (5, 'w') 往 指 定位 置 插入 字符 
>>>print (sa) 
array ('u', 'Fellow world') 

>>>sa.renve('1') 制 除 指定 字符 的 首次 出 现 
>>>Print (sa) 
array ('u', 'Felow world') 

>>>sa.remve('w') 


>>>print (sa) 
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array ('u', 'Felo world') 
>>>ia =array('I') 鹤 | 建 整 型 数组 
>>>for i in range (5): 
ia.append(i) 

>>>ia 

array ('I', [0,1,2,3,4]) 

>>>ia[0] 本 

>>>ia 

array('T' [5,1,2,3,4]) 


363 队列 


Python 标准 库 queue 提供 了 LILO 队列 类 Queue 、LIFO 队列 类 LifoQueue 优先 级 队列 
类 PriorityQueue ,标准 库 collections 提供 了 双 端 队列 。 例 如 : 


>>>fram quneue inport Queue ID 队列 

>>>q=eueue0 家 | 建 队 列 对 象 

>>>q.-Pu 上 OO) 三 队列 尾部 插入 元 素 
>>>q.pt (0) 

>>>q.put C) 

>>>print (qd.qaeue) 得 看 队列 中 的 所 有 元 素 
Geqpe ([0,1,2]) 

>>>q-get () 媒 回 并 删除 队列 的 头 部 元 素 
0 

>>>q.9get () 

法 

>>>q.9get () 
2 

>>>fram queue inport Lifcoueue 在 IFO 队 列 

>>>q Aifcoeue() 枪 | 建 LIFO 队 列 对 象 
>>>q-:pt GD) 症 队 列 尾部 插入 元 素 
>>>q-pt 2) 

>>>q.pt G) 

>>>q.qneue 得 看 队列 中 的 所 有 元 素 
[1,2,3] 

>>>q-get () 贱 回 并 删除 队列 尾部 元 素 
3 

>>>q.get 0) 

>>>q-qneue 


[21] 
>>>q.get 0) 寻 空 队列 调用 gst0 方 法 会 阻塞 当前 线程 
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>>>from queve import Priorityoueue 
>>>G=PriorityQuseoe (0) 
>>>q-pt G) 
>>>q-pxt (8) 
>>>q-put do0) 
>>>q.qeue 
[3,8,100] 
>>>q-:-pPt (0) 
>>>q.pt 2) 
>>>q.qeue 
[1,2,100,8,3] 
>>>q.get () 
入 
>>>q.get () 
2 


>>>from collecticns jmport deqe 
>>>G=aecqne rexlen 5) 

>>>for item in [3,5,7,9,11]: 

-pend (item) 

>>>q.aFpend (3) 
>>>q.append 05) 
>>>G 

Geqe([7,9,11,13,15] ,mexlen =5) 
>>>q.appendleft (5) 
>>>G 

GEgne([5,7,9, 了 ,13]vmexaen 5) 
>>>q.popleft () 

SS 
>>>G.Pop() 

3 
>>>G 

Geqe([7,9,11] ,mexlen 5) 
>>>q.insert ,10) 
>>>G 

Geqe([7,9,10,11] ,mexlen =5) 
>>>q+=[1,2] 
>>>G 

Geqe ([9,10,11,1,2] ,mexlen 5) 
>>>q-Pop() 

2 
>>>q.-Pop 0 

工 
>>>G 


舟 先 级 队列 

着 | 建 优先 级 队列 对 象 

二 和 元素 

二 和 人 元 素 

得 看 优先 级 队列 中 的 所 有 元 素 


炳 和 元素, 自动 调整 优先 级 队列 


娠 回 并 删除 优先 级 最 低 的 元 素 


网 执行 几 次 该 语句 并 观察 返回 的 数据 


覃 建 双 端 队列 
评 加 元 素 


稚 列 满 ,自动 溢出 


扒 左 侧 添加 元 素 , 右 侧 自动 溢出 


群 出 并 返回 最 左 端 元 素 


群 出 并 返回 最 右 端 元素 


寿 中 间 位 置 插入 元 素 


钥 加 多 个 元 素 
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Geqe ([9,10,11] ,msden 5) 
>>>q* 之 

>>>q 

Ceqpe ([10,11,9,10,11] ,maxlen =5) 
>>>q-comt (0) 

也 

>>>q.rotate C) 

>>>q 

Ceqpe ([10,11,10,11,9] ,mxden =5) 
>>>q.rotate( 2) 

>>>q 

deqpe ([10,11,9,10,11] ,mxlen =5) 


364 具名 元 组 


>>>fram collecticns import namedbple 


>>>Eoint nearedbple ('Point', [x','y','2"]) 


>>>Point 

<class' main _.point'> 
>>>pP -Foint (3,4,5) 

>>>p 

Eoint (x=3,y -4,2 5) 
>>>p.x 

3 

>>>p._fields 
WE 
>>>p._replace (x=30,z =8) 
Boint (x =30,y ,z=8) 





秆 列 重复 


上 回 元 素 的 出 现 次 数 


着 环 右 移 2 个 元 素 


大 环 左 移 2 个 元 素 


创建 具名 元 组 类 


奖 例 化 对 象 


炉 问 成 员 
佑 看 字段 列表 


乎 换 成 员 值 ,返回 新 对 象 


>>>p-x 污 古人 允许 这 样 直 接 赋值 
Dttriputeprror: can't set attripute 

>>>d=ctict(0) 

>>>d[p] ='spirit position' 得 名 元 组 对 象 可 以 作为 字典 的 “ 键 ” 

>>>G 


{Point (x=3,y=4,z 5): 'spirit positian'} 
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堆 是 一 个 特殊 的 二 又 树 ,其 中 每 个 父 节点 的 值 都 小 于 或 等 于 其 所 有 子 节 点 的 值 。 使 
用 数组 或 列表 来 实现 小 根 堆 时 ,对 于 所 有 的 k( 下 标 ,从 0 开始) 都 满足 heap[k] < = 
heap[2*k+1] 和 heap[k] < = heap[2*k+2], 并 且 整 个 堆 中 最 小 的 元 素 总 是 位 于 二 又 
树 的 根 节点 ,大 根 堆 与 小 根 堆 正 好 相反 。Python 在 heapq 模块 中 提供 了 对 堆 的 支持 。 


>>>inport hespq 朵 入 hespq 模 块 
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>>>inport rancom 
>>>Gata =randam. sanple (range (1000) ,10) 
>>>Gata 
[638,659,212,84,737,677,553,340,526,747] 
>>>heapqd.heapify (data) 
>>>Gata 
[84,340,212,526,737,677,553,659,638,747] 
>>>heapq.-heappush (data, 30) 
>>>Gata 
[30,84,212,526,340,677,553,659,638,747,737] 
>>>hespq-heappush (data, 5) 
>>>Gata 
[5,84,30,526,340,212,553,659,638,747,737,677] 
>>>heapdqd.heaopop (Gata) 
5 
>>>heapd.heacpop (Gata) 
30 
>>>heapd.heaopop (Gata) 
84 
>>>Gata 
[212,340,553,526,737,677,747,659,638] 
>>>heapd.heeacpusbhpop (Gata, 1000) 
212 
>>>Gata 
[340, 526, 553, 638,737,677,747,659,1000] 
>>>heapq.heapreplace (data, 500) 
340 
>>>Gata 
[500, 526,553, 638,737,677,747,659,1000] 
>>>heap9.heapreplace (data, 700) 
500 
>>>Gata 
[526,638,553,659,737,677,747,700,1000] 
>>>heeapd.nlarogPst (3,data) 
[1000,747,737] 
>>>heepq.nsrallest ©,data, key =str) 
[1000,526] 


奈 成 随机 测试 数据 


奉化 随机 测试 数据 


新 元 素 人 堆 , 自 动 调整 堆 结构 


贩 回 并 删除 最 小 元 素 , 自 动 调整 堆 


群 出 最 小 元 素 ,同时 新 元 素 入 堆 


群 出 最 小 元 素 ,同时 新 元 素 人 堆 


娠 回 最 大 的 前 3 个 元 素 


娠 回 指定 排序 规则 下 最 小 的 2 个 元 素 
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有 了 合适 的 数据 类 型 和 数据 结构 之 后 ,还 要 依赖 于 选择 和 循环 结构 来 实现 特定 的 业 
务 罗 辑 。 一 个 完整 的 选择 结构 或 循环 结构 可 以 看 作 是 一 个 大 的 “语句 " ,从 这 个 角度 来 
讲 ,程序 中 的 多 条 “语句 "是 顺序 执行 的 。 


4.1 条 件 表 达 式 


在 选择 结构 和 循环 结构 中 ,都 要 根据 条 件 表达 式 的 值 来 确定 下 一 步 的 执行 流程 。 条 件 
表达 式 的 值 只 要 不 是 False .0( 或 0.0 .0j 等 ) . 空 值 None 、 空 列表 、 空 元 组 、 空 集合 、 空 字典 、 空 
字符 串 、 空 range 对 象 或 其 他 空 迭 代 对 象 ,Python 解释 器 均 认 为 与 True 等 价 。 从 这 个 意义 上 
来 讲 ,所 有 的 Python 合法 表达 式 都 可 以 作为 条 件 表达 式 ,包括 含 有 函数 调用 的 表达 式 。 

关于 表达 式 和 运算 符 的 详细 内 容 请 参考 2. 2 节 , 这 里 再 重点 介绍 一 下 几 个 比较 特殊 
的 运算 符 。 


1. 关系 运算 符 


Python 中 的 关系 运算 符 可 以 连续 使 用 ,这 样 不 仅 可 以 减少 代码 量 , 也 比较 符合 人 类 的 
思维 方式 。 


>>>print ( < <) 往 价 于 1Q and2 了 有 

True 

>>>print 0 < 33) 

False 

>>>print 4 3 >2) 

True 

在 Python 语法 中 ,条件 表达 式 中 不 允许 使 用 赋值 运算 符 ” =” ,避免 了 误 将 关系 运算 
符 “ = = ”写成 赋值 运算 符 ”= " 带 来 的 麻烦 。 在 条 件 表 达 式 中 使 用 赋值 运算 符 ” = "将 抛 
出 异常 ,提示 语法 错误 。 

>>>if a3: 上 交 件 表达 式 中 不 允许 使 用 赋值 运算 符 


SyntaxError: irvalid syntax 
>>>if (a3) and 4): 
SyntaxError: irvalid syntax 
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关系 运算 符 具 有 惰性 计算 的 特点 ,只 计算 必须 计算 的 值 , 而 不 是 计算 关系 表达 式 中 的 
每 个 表达 式 。 


>>31 2 wr 站 前 上 下 文中 并 不 存在 变量 xox 
False 


2. 逻辑 运算 符 

逻辑 运算 符 and ,or .not 分别 表 示 与 或、 非 3 种 逻辑 运算 ,在 功能 上 可 以 与 电路 的 连 
接 方式 做 个 简单 类 比 : or 运算 符 类 似 于 并 联 电路 ,只 要 有 一 个 开关 是 通 的 那么 灯 就 是 亮 
的 ;and 运算 符 类 似 于 串联 电路 ,必须 所 有 开关 都 是 通 的 灯 才 会 亮 ;not 运算 符 类 似 于 短路 
电路 ,如 果 开 关 通 了 那么 灯 就 灭 了 ,如 图 4-1 所 示 。 


g: &: c 
=。 

















Kl1 


| Kl K2, 


(a) or, 类似 于 并 联 电路 (b) and, 类 似 于 串联 电路 (c) not 类 似 于 短路 
图 4-1 光 辑 运算 符 与 几 种 电路 的 类 比 关系 
































与 关系 运算 符 类 似 ,逻辑 运算 符 and 和 or 具有 短路 求 值 或 惰性 求 值 的 特点 ,可 能 不 
会 对 所 有 表达 式 进行 求 值 ,而 是 只 计算 必须 计算 的 表达 式 的 值 。 以 and 为 例 , 对 于 表达 式 
“表达 式 1 and 表达 式 2" 而 言 ,如 果 “ 表 达 式 1” 的 值 为 False 或 其 他 等 价值 时 ,不论 “表达 
式 2" 的 值 是 什么 ,整个 表达 式 的 值 都 是 False ,丝毫 不 受 “ 表 达 式 2" 的 影响 ,因此 “表达 式 
2" 不 会 被 计算 。 在 设计 包含 多 个 条 件 的 条 件 表 达 式 时 ,如 果 能 够 大 概 预 测 不 同 条 件 失 败 
的 概率 ,并 将 多 个 条 件 根据 and 和 or 运算 符 的 短路 求 值 特性 来 组 织 顺 序 ,可 以 提高 程序 
运行 效率 。 

>>>3 and5 

5 

>>>3 cr 5 

3 

>>>0 and5 

0 

>>>0 cr 5 

5 

>>>not 3 

False 

>>>not 0 

True 
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下 面 的 函数 使 用 指定 的 分 隔 符 把 多 个 字符 串 连 接 成 一 个 字符 串 ,如 果 用 户 没 有 指定 
分 隔 符 则 使 用 逗号 。 
>>>0ef Join (dList, ssp Aone) : 
retim (sep or ', ') .join(christ) 诗意 : 参数 sep 不 是 字符 串 时 会 抛 出 异常 
>>>cHTest =['1"', 21,'3', 14','51] 
>>>Upin (diTest) 
"1,2,3,4,5" 
>>>oin (diTest, ':') 
'1:2:3:4:5" 
当然 ,也 可 以 把 上 面 的 函数 直接 定义 为 下 面 带 有 上 默认 值 参数 的 形式 : 
>>>aef Join (chList, sep=", '): 
retim sep.join(hList) 


4.2 选择 结构 


常见 的 选择 结构 有 单 分 支 选择 结构 . 双 分 支 选 择 结构 .多 分 支 选择 结构 以 及 嵌 套 的 分 
支 结构 ,也 可 以 构造 跳 转 表 来 实现 类 似 的 逻辑 。 另 外 ,循环 结构 和 异常 处 理 结构 中 也 可 以 
带 有 else 于 句 , 可 以 看 作 是 特殊 形式 的 选择 结构 ,请 参考 4.3 节 和 11.1 节 的 介绍 。 


421 单 分 支 选 择 结构 


单 分 支 选 择 结构 语法 如 下 所 示 ,其 中 表达 式 后 面 的 冒号 * :" 是 不 可 缺少 的 ,表示 一 个 
语句 块 的 开始 ,并 且 语 句 块 必须 做 相应 地 缩 进 ,一 般 是 以 4 个 空格 为 缩 进 单位 。 
if 表达 式 : 
语句 块 
当 表 达 式 值 为 True 或 其 他 与 True 等 价 的 值 时 ,表示 条 件 满足 ,语句 块 被 执行 ,否则 
该 语句 块 不 被 执行 ,而 是 继续 执行 后 面 的 代码 (如 果 有 的 话 ) ,如 图 4-2 所 示 。 
下 面 的 代码 演示 了 单 分 支 选择 结构 的 用 法 : 
x=irpt ('Iput two nmibers:') 
a/b mep (int,x.split ()) 
if a>p: 
arb=ba 秆 列 解 包 , 交 换 两 个 变量 的 值 
print ab) 
在 Python 中 ,代码 的 缩 进 非 常 重要 , 缩 进 是 体现 代码 逻辑 关系 的 重要 方式 ,同一 个 代 
码 块 必须 保证 相同 的 缩 进 量 。 在 实际 开发 中 ,只 要 遵循 一 定 的 约定 ,Python 代码 的 排版 是 
可 以 降低 要 求 的 ,例如 下 面 的 代码 ,虽然 不 建议 这 样 写 ,但 确实 是 可 以 执行 的 。 
>>>if 3 2: print (ak 车 | 果 语 句 较 短 , 可 以 直接 写 在 分 支 语句 后 面 
ok 
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>>>if True:print G) ;print G) 狂 一 行 写 多 个 语句 ,使 用 分 号 分 隔 

3 

于 


条 件 表达 式 是 否 成 立 ? 



























































图 4-2 单 分 支 选 择 结构 图 4-3” 双 分 支 选 择 结 构 


422 双 分 支 选择 结构 
双 分 支 选择 结构 的 语法 为 
并 表达 式 : 
语句 块 1 
else: 
语句 块 2 
当 表 达 式 值 为 True 或 其 他 等 价值 时 ,执行 语句 块 1 ,否则 执行 语句 块 2。 语 句 块 1 或 
语句 块 2 总 有 一 个 会 执行 ,然后 再 执行 后 面 的 代码 (如 果 有 的 话 ) ,如 图 4-3 所 示 。 
下 面 的 代码 通过 鸡 免 同 笼 问 题 演示 了 双 分 支 结构 的 用 法 。 
jitatui -ep (int,input(" 请 输入 鸡 锡 总 数 和 腿 总 数 : ') .split 0)) 
ta=(bui -jitu* 2)/2 
if int (by ==u: 
Frimt(' 鸡 : {0}, 兔 : {1}' .fommat (int Gitu-t),int (by))) 
else: 
print ("数据 不 正确 ,无 解 ') 
另外 ,Python 还 提供 了 一 个 三 元 运算 符 , 并 且 在 三 元 运算 符 构 成 的 表达 式 中 还 可 以 拒 
套 三 元 运算 符 ,可 以 实现 与 选择 结构 相似 的 效果 。 语 法 为 
当 条 件 表达 式 condition 的 值 与 True 等 价 时 ,表达 式 的 值 为 valuel ,否则 表达 式 的 值 


为 value2。 另 外 ,valuel 和 value2 本 身 也 可 以 是 复杂 表达 式 , 也 可 以 包含 函数 调用 ,甚至 
可 以 是 三 元 运算 符 构 成 的 表达 式 。 这 个 结构 的 表达 式 也 具有 惰性 求 值 的 特点 。 
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>>>Ba zx 

>>>print (6) if a33 else print 6) 

6 

>>>print (6 iEa>x3 else 5) 

6 

>>>p=6 迁 a 习 3 else 9 

>>2 

» 

>>>x math.sqrt (9) if 5 >33 else randam.randint (1,100) 
Namregrror: nare "math' is not defined 

>>>import math 

>>>x math.sqrt (9) if 5 >3 else randam.randint (1,100) 


>>>x math.sqrt (9) if 2 33 else randam.randint (1,100) 


NEmeError: nare 'randam' js not defined 
>>>inport randem 
>>>x rath.sqrt (9) if 2 >3 else randam.randint (1,100) 


盘 然 结果 与 上 一 行 代码 一 样 ,但 代码 含义 不 同 


赋值 运算 符 的 优先 级 非常 低 


证 没有 导入 math 模 块 


主 没 有 导入 rancm 模 块 

租 表达 式 5 冯 的 值 为 Tre 
新 以 可 以 正常 运行 

上 交 件 表达 式 2 冯 的 值 为 False 
希 要 计算 第 二 个 表达 式 

得 此 时 还 没 导 入 random 

新 以 出 错 


本 入 random, 成 功 执行 


虽然 三 元 运算 符 可 以 诗 套 使 用 ,可 以 实现 复杂 的 多 分 支 选择 结构 的 效果 ,但 这 样 的 代 


码 可 读 性 非常 差 ,不 建议 使 用 。 


>> 交 了 


>>>(L if x>2 else 0) if f(x) 5 else ('a' if x<5 else 'b') 


1 
>>>x0 


>>>( if x>2 else 0) if f(x) 5 else ('a' if x<5 else 'b') 


"ar 


423 多 分 支 选 择 结 构 
多 分 支 选择 结构 的 语法 为 
迁 表 达 式 1: 
语句 块 1 
elif 表达 式 2: 
语句 块 2 
elif 表达 式 3: 
语句 块 3 


语句 块 n 


条 以 宜 套 使 用 ,建议 不 这 样 写 


99 
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其 中 ,关键 字 elif 是 else if 的 缩写 。 下 面 的 代码 演示 了 如 何 利用 多 分 支 选 择 结构 将 成 绩 
从 百分制 变换 到 等 级 制 。 


GEf finc (score) : 
if soore 3100 cr score<0: 
Tetmm "wrong soore.mst between 0 and 100." 
elif score >=90: 
retim 'A' 
elif soore >=80: 
retim 'B' 
elif score >370: 
Tetbmm 'C" 
elif score >=60: 
Tebmm 'D'" 
else: 
retim 'E' 


424 选择 结构 的 赃 套 
选择 结构 可 以 进行 腐 套 来 实现 复杂 的 业务 逻辑 ,语法 如 下 : 


{表达 式 1: 
语句 块 1 
if 表达 式 2: 
3 2 2 ff 表达 式 1: 
语句 块 2 语句 块 1 
else: 六 表达 式 2: 
语句 块 3 本 引 语句 块 2 
else: 
else: 3| 语句 块 3 
if 表达 式 4: else: 
语 放 六 表达 式 4: 
语句 块 4 引 语句 块 4 


上 面 语法 示意 中 的 代码 层次 和 隶属 关系 如 图 44 所 示 ， 图 44 代码 层次 与 隶属 关系 
注意 相同 层次 的 代码 必须 具有 相同 的 缩 进 量 。 
使 用 赃 套 选择 结构 时 ,一定 要 严格 控制 好 不 同 级 别 代码 块 的 缩 进 量 ,因为 这 决定 了 不 
同 代 码 块 的 从 属 关系 和 业务 逻辑 是 否 被 正确 地 实现 ,以 及 代码 是 否 能 够 被 解释 器 正确 理 
解 和 执行 。 例 如 ,前 面 百分制 转 等 级 制 的 代码 ,作为 一 种 编程 技巧 ,还 可 以 尝试 下 面 的 
写法 : 
Gef fnc (score) : 
Cegree 一 DCEPRRE 
证 score 习 00 or soore<0: 
retum "wrong-score mst between 0 and 100." 
else: 
index =(soore -60) // 10 


SS 
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if incex >-0: 

ITEbum degree[index] 
else: 

IEbum degree[ 1] 


425 构建 跳 转 表 实现 多 分 支 选 择 结构 


使 用 列表 ,元 组 或 字典 可 以 很 容易 构建 跳 转 表 , 在 某 些 场合 下 可 以 更 快速 地 实现 类 似 
于 多 分 支 选 择 结构 的 功能 。 例 如 ,下 面 的 代码 根据 用 户 输入 内 容 的 不 同 来 调用 不 同 的 丁 
数 完 成 不 同 的 功能 ,其 中 就 用 到 了 字典 形式 的 跳 转 表 。 
funcpict ={'1':1anbda:print (ryou irmput 1°), 
‘2':1anbda:print (‘You irput 2'), 
'3"':1anbda:print (ryou input 3')} 


4.3 循环 结构 


431 fa 循环 与 while 循环 


Python 主要 有 for 循环 和 while 循环 两 种 形式 的 循环 结构 ,多 个 循环 可 以 拒 套 使 用 ,并 
且 还 经 常 和 选择 结构 艇 套 使 用 来 实现 复杂 的 业务 逻辑 。while 循环 一 般 用 于 循环 次 数 难 
以 提前 确定 的 情况 ,当然 也 可 以 用 于 循环 次 数 确定 的 情况 ;for 循环 一 般 用 于 循环 次 数 可 
以 提前 确定 的 情况 ,尤其 适用 于 枚 举 或 遍历 序列 或 迭代 对 象 中 元 素 的 场合 。 对 于 带 有 
else 子 句 的 循环 结构 ,如果 循环 因为 条 件 表达 式 不 成 立 或 序列 遍历 结束 而 自然 结束 时 则 
执行 else 结构 中 的 语句 ,如 果 循 环 是 因为 执行 了 break 语句 而 导致 循环 提前 结束 则 不 会 
执行 else 中 的 语句 。 两 种 循环 结构 的 完整 语法 形式 分 别 为 
while 条 件 表达 式 : 
循环 体 
[else: 
else 子 句 代 码 块 ] 


for 取 值 im 序列 或 欠 代 对 象 : 
循环 体 
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其 中 , 方 括号 内 的 else 子 句 可 以 没有 ,也 可 以 有 。 下 面 的 代码 使 用 循环 结构 遍历 并 输出 列 
表 中 的 所 有 元 素 。 
a list=['a', 'b', mpilgrim' 'z", 'eanple'] 
for ivv in emerate (a 1ist): 
Erirt(" 列 表 的 第 ' 江 忆 , "个 元 素 是 : ',v) 
下 面 的 代码 用 来 输出 1 ~ 100 之 间 能 被 7 整除 但 不 能 同时 被 5 整除 的 所 有 整数 。 


for i in range (1,101): 
if i%7==0 and i%5! =0; 
Print (i) 
下 面 的 代码 使 用 嵌 套 的 循环 结构 打印 九 九 乘法 表 。 


for i in range (1,10): 
for j in range (l,i 1): 
Print ('{0} * {1} ={2}"'.fomat (i,j,i* j),end=" ') 
Print () 打印 空 行 
下 面 的 代码 演示 了 带 有 else 子 句 的 循环 结构 ,该 代码 用 来 计算 1 +2 +3 +…' +99 + 
100 的 结果 
S0 
for i in range (1,101): 丁 包 括 101 
s+ 过 
else: 
print (s) 
下 面 的 代码 使 用 while 循环 实现 了 同样 的 功能 : 
ss 
while i <3400: 
5+ 孝 
i+ 导 4 
else: 
print (s) 
当然 ,上 面 的 两 段 代码 只 是 为 了 演示 循环 结构 的 用 法 ,其 中 的 else 子 句 实际 上 并 没有 
必要 ,循环 结束 后 直接 输出 结果 就 可 以 了 。 另 外 ,如 果 只 是 要 计算 1 +2 +3 +… +99 + 
100 的 值 的 话 ,直接 用 内 置 函 数 sum( ) 和 range( ) 就 可 以 了 。 


>>>sm(range (1,101)) 
5050 


432 ”break 与 oontinue 语句 
break 与 continue 语句 在 while 循环 和 for 循环 中 都 可 以 使 用 ,并 且 一 般 常 与 选择 结构 
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或 异常 处 理 结构 结合 使 用 。 一旦 break 语句 被 执行 ,将 使 得 break 语句 所 属 层次 的 循环 提 
前 结束 ;continue 语句 的 作用 是 提前 结束 本 次 循环 ,忽略 continue 之 后 的 所 有 语句 ,提前 进 
人 下 一 次 循环 。 
下 面 的 代码 用 来 计算 小 于 100 的 最 大 素数 , 内 循环 用 来 测试 特定 的 整数 n 是 否 为 素 
数 ,如 果 其 中 的 break 语句 得 到 执行 则 说 明 n 不 是 素数 ,并 且 由 于 循环 提前 结束 而 不 会 执 
行 后 面 的 else 子 句 。 如 果 某 个 整数 n 为 素数 , 则 内 循环 中 的 break 语句 不 会 执行 ,内 循环 
自然 结束 后 执行 后 面 else 子 句 中 的 语句 ,输出 素数 n 之 后 执行 break 语句 跳出 外 循环 。 
for n in range (100,1, 311): 
if n%2==0: 
continue 
for i in range (3,int Nn**0.5) +41,2): 
if nsi==0: 
结束 内 循环 
break 
else: 
Print n) 
结束 外 循环 
break 
需要 注意 的 是 ,过 多 的 break 和 continue 语句 会 降低 程序 的 可 读 性 。 因 此 ,除非 break 
或 continue 语句 可 以 让 代码 更 简单 或 更 清晰 ,否则 不 要 轻易 使 用 。 


433 ”循环 代码 优化 技巧 


实际 开发 中 ,正确 实现 了 预定 功能 之 后 ,一 般 还 需要 再 优化 一 下 代码 以 追求 更 高 的 执 
行 效率 。 如 果 能 从 算法 层面 上 进行 优化 , 那 毫 无 疑问 会 带 来 效率 的 大 幅度 提升 。 例 如 , 判 
断 一 个 大 整数 n 是 否 为 素数 ,如 果 根据 素数 定义 去 判断 的 话 应 该 逐个 测试 [2,n - 1] 区间 
上 的 数 是 否 能 够 整除 n, 而 实际 上 只 需要 判断 从 2 到 n 的 平方 根 这 个 小 范围 就 可 以 了 ,再 
进一步 说 ,实际 上 只 需要 判断 2 以 及 3 到 n 的 平方 根 之 间 所 有 奇数 这 个 更 小 的 范围 。 对 
于 大 整数 n 来 说 ,循环 次 数 和 余数 运算 的 次 数 减少 是 非常 可 观 的 ,n 越 大 算法 效率 的 提高 
越 显著 。 

在 编写 循环 语句 时 ,应 尽量 减少 循环 内 部 不 必要 或 无 关 的 计算 ,与 循环 变量 无 关 的 代 
码 应 该 尽 可 能 地 提取 到 循环 之 外 。 尤 其 是 多 重 循环 戏 套 的 情况 ,一 定 要 尽量 减少 内 层 循 
环 中 不 必要 的 计算 , 尽 最 大 可 能 地 把 计算 向 外 提 。 例 如 下 面 的 代码 ,第 二 段 明显 比 第 一 段 
的 运行 效率 要 高 。 

digits=(,2,3,4) 


for i in range (1000) : 
resut =[] 
for i in digits: 
for j in digits: 
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for k in digits: 
result.apgpend(i 油 00 茹 昌 0 +k) 


for i in range (1000) : 
result =[] 
for i in digits: 
主考 疯 00 
for j in digits: 
ja0 
for k in digits: 
result .append(i 1 Ho 
另外 ,在 循环 中 应 尽量 引用 局 部 变量 ,局 部 变量 的 查询 和 访问 速度 比 全 局 变量 略 快 。 
同样 的 道理 ,在 使 用 模块 中 的 方法 时 ,可 以 通过 将 其 转换 为 局 部 变量 来 提高 运行 速度 。 例 
如 下 面 的 代码 ,第 二 段 代 码 的 速度 就 比 第 一 段 代 码 略 快 。 当 然 ,也 可 以 使 用 from math 
import sin as loc_sin 来 代替 其 中 的 写法 。 


inport math 


for i in range (10000000) : 
meth.sin(i) 


for 1 in range (10000000) : 
lcc_ sin(i) 

代码 优化 涉及 的 内 容 非 常 广泛 ,除了 在 算法 层面 的 优化 之 外 ,编码 过 程 本 身 对 程序 员 
的 功底 要 求 也 非常 高 。 除 了 上 面 介绍 的 循环 代码 优化 ,本 书 其 他 章节 中 也 会 涉及 一 些 优 
化 的 内 容 。 例 如 ,如 果 经 常 需要 测试 一 个 序列 是 否 包 含 一 个 元 素 就 应 该 尽量 使 用 字典 或 
集合 而 不 使 用 列表 ,把 多 个 字符 串 连 接 成 一 个 字符 串 时 尽量 使 用 join( ) 方法 而 不 要 使 用 
运算 符 + ,对 列表 进行 元 素 的 插入 和 删除 操作 时 应 尽量 从 列表 尾部 进行 ,等 等 。 实 际 开发 
中 需要 注意 的 是 ,首先 要 把 代码 写 对 ,保证 完全 符合 功能 要 求 , 然 后 再 进行 必要 的 优化 来 
提高 性 能 。 过 早 地 追求 性 能 优化 有 时 候 可 能 会 带 来 灾难 而 浪费 大 量 精力 。 


4.4 精彩 案例 赏析 


示例 4-1 输入 若干 个 成 绩 , 求 所 有 成 绩 的 平均 分 。 每 输入 一 个 成 绩 后 询问 是 否 继 
续 输 入 下 一 个 成 绩 ,回答 yes 就 继续 输入 下 一 个 成 绩 ,回答 no 就 停止 输入 成 绩 。 


rnbers =[] 辣 用 列表 存放 临时 数据 
while True: 
x=input(' 请 输入 一 个 成 绩 : ) 
try: 峰 常 处 理 结构 有 关 知 识 见 第 11 章 


ninbers.append (Hoat (9 ) 
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expept: 
print (' 不 是 合法 成 绩 ') 
while True: 


匡 ag -imput ("继续 输入 吗 ? (yes/mD) ') 
if flag.lower() not in ('yes', mo'): 


Erint(" 只 能 输入 yes 或 mp') 
else: 
Lreak 
if flag.lower() =="no': 
break 


Print (sum(nnbers) /len (mbers)) 


和 荫 定 用 户 输入 内 容 必须 为 Yes 或 mp 


示例 4-2 编写 程序 ,判断 今天 是 今年 的 第 几 天 。 


inport time 


Gate time.1localtime () 
YEarrmcnthvaay =cate[:3] 


Gay month=[31,28,31,30,31,30,31,31,30,31,30,31] 
证 year® 400 =-0 or (year® 4==0 and year® 100! =0): 


day ronth[1] -9 


if mnth=3: 
Erint (cay) 
else: 


Print (sm(day_ month[:mconth -1]) +Gay) 


效 取 当前 日 期 时 间 


出 断 是 否 为 国 年 


Python 标准 库 datetime 提供 了 datetime 和 timedelta 对 象 可 以 很 方便 地 计算 指定 年 、 
月 日. 时、 分 . 秒 之 前 或 之 后 的 日 期 时 间 ,还 提供 了 返回 结果 中 包含 “今天 是 今年 第 几 天 ” 
“今天 是 本 周 第 几 天 "等 答案 的 timetuple( ) 函数 ,等 等 。 


>>>inport datetire 
>>>Today =catetimre .date.today () 
>>>Today 

catetime.date (2016,10,8) 


>>>mbday -datetime.date (Today.year,1,1) +datetime.timedelta(days3) 


catetime. timedelta (282) 
>>>Today.timetiple() .tm yday 
282 

>>>Today.replace (year -2013) 
catetime.date (C013,10,8) 
>>>Today.replace tronth 3) 
catetime.date (2016,1,8) 

>>>now -datetime .datetime.now () 
>>>now 

datetime .datetime (2016,10,8,15,55,16,272174) 
>>>now.replace (second =30) 


岭 天 是 今年 的 第 几 天 
替换 日 期 中 的 年 


替换 日 期 中 的 月 


将 换 日 期 时 间 中 的 秒 
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Catetime.datetime (2016,10,8,15,55,30,272174) 
>>>now +catetime.timedelta (days =5) 补 算 5 天 后 的 日 期 时 间 
Catetime .datetime (2016,10,13,15,55,16,272174) 
>>>now +datetime.timedelta (weeks =-5) 革 算 5 周 前 的 日 期 时 间 


Catetime .datetime (2016,9,3,15,55,16,272174) 
>>>Gef dayspetween (yearl ,monthl ,dayl, year? ,mnth?, day2) : 


fram Gatetime import date 峙 算 两 个 日 期 之 间 相差 多 少 天 
dif -cate (yearl,ronthl ,dayl) -Gate (Year2,nmcnth2vaay2) 
retim dif.cays 


>>>GaysBetween (C016,12,11,2016,11,27) 
14 
>>>GaysBetween (2016,12,11,2011,11,27) 


1841 

另外 ,标准 库 calendar 也 提供 了 一 些 与 日 期 操作 有 关 的 方法 。 例 如 : 
>>>import calencar 本 入 模块 

>>>print (calencar.calencar C016)) 得 看 2016 年 的 日 历 表 , 结 果 略 
>>>print (calencar.month (2016,11)) 以 看 2016 年 11 月 份 的 日 历 表 
>>>calencar.isleap (2016) 出 朵 是 否 为 浆 年 

Te 

>>>calencar.weekcay (2016,10,26) 做 看 指定 日 期 是 周 几 


2 


当然 ,也 可 以 自己 编写 代码 模拟 Python 标准 库 calendar 中 查看 日 历 的 方法 。 
fram Gatetime import cate 
GysofMnth =[31,28,31,30,31,30,31,31,30,31,30,31] 


Gef myCalendar (Yearrcnth) : 

岁 取 Year 年 month 月 1 日 是 周 几 
start -Gate (year,month,1) .timebple () .tm way 
林 印 头 部 信息 
Print ("{0} 年 和} 月 日 历 '.fomat (year,month) .oanter (56)) 
Print(' 日 七 一 七 二 上 续 三 二 四 七 五 污 六 9 
肉 取 该 月 有 多 少 天 ,如 果 是 2 月 并 且 是 闸 年 ,适当 调整 一 下 
cay -caysofMPnth month +1] 
if mnth=22: 

证 year® 400==0 or Gears4 一 -0 and year® 100! -0): 

Gay + 习 

上 矿 成 数据 ,根据 需要 在 前 面 填充 空白 
result =[' '* 8 for i in range (start #1)] 
result +Aist rap (larbda d: str (9) .1just (8),range(l,day 1))) 
朵 印 数据 
for i,day in enmerate (result) : 
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if i!=0 and i%$7==0: 
print 0 
Print (day,end="") 
print 0 


cef rain (year,nonth=71): 
j type (year) ! =int or year <1000 cr Year 刁 0000: 
Print ('Year error') 
retim 
if type tronth) ==int: 
茹 果 没 有 指定 月 份 ,就 打印 全 年 的 日 历 
if mnth==1: 
for m in range (1,13): 
myCalendar (year,m) 
区 果 指定 了 月 份 , 就 只 打印 这 一 个 月 的 日 历 
elif ronth in range (1,13): 


TYCalencar (year,month) 
else: 
Print (Enth error') 
IEtmm 
else: 
Print (MEnth error') 
retim 
main (2017) 
示例 4-3 编写 代码 ,输出 由 星 号 * 组 成 的 萎 形 图 案 , 并 且 可 以 灵活 控制 图 案 的 大 小 。 
Gef rainn) : 


for i in rangen) : 

Print(('* '*i).oenter(n* 3)) 
for i in range (n,0, 1): 

print (('* '*1i).aenter(n* 3)) 


图 4-5 和 图 4-6 分 别 为 参数 n =6 和 n=10 的 运行 效果 。 


画作 居 二 : 衣 , 训 下 装 : : 夺 -和 


图 4-5 n=6 的 运行 效果 图 4-6 n=10 的 运行 效果 
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示例 4-4 快速 判断 一 个 数 是 否 为 素数 。 


n=irput ("Tput an integer:") 
n=int (n) 
ifn=32: 
Print ('Yes') 
得 数 必然 不 是 素数 
elif ns2==0: 
Erint (No') 
else: 
捧 于 5 的 素数 必然 出 现在 6 的 倍数 两 侧 
铀 为 x 二 6x 苇 .6x 坝 肯定 不 是 素数 ,假设 x 为 大 于 1 的 自然 数 
man%6 
证 ml 本 andm! 5: 
print (No') 
else: 
for i in range (G3,int Mm*®.5) ,2): 
if ni==0; 
print (Nb 
break 
else: 
Erint ('Yes') 
示例 4-5 ”编写 程序 ,计算 组 合 数 C(n.,i) , 即 从 mn 个 元 素 中 任 选 i 个 ,有 多 少 种 选 法 。 
根据 组 合 数 定义 ,可 以 编写 代码 如 下 : 
jimport math 
ef Cnil ni): 
retim int trath. factorial (n) /math.factorial (i) /math.factorial on -i)) 
虽然 在 Python 中 不 用 担心 数字 太 大 而 超过 变量 的 表示 范围 ,但 是 计算 大 整数 的 阶乘 
也 确实 需要 一 些 时 间 ,尤其 是 上 面 的 函数 中 存在 大 量 的 重复 计算 ,严重 影响 速度 。 如 果 把 
组 合 数 的 定义 展开 并 化 简 一 下 的 话 可 以 发 现 其 中 隐藏 的 规律 ,以 Cni(8,3) 为 例 ， 
Caif 8 3 =B3A(B=3)! =(SXTXGXSX4X3SMX2ZXKXLXC3S X2 KI NS HANIR2 
1) ,对 于 (5 ,8] 区 间 的 数 ,分 子 上 出 现 一 次 而 分 母 上 没 出 现 ;(3,5] 区间 的 数 在 分 子 、 分 母 
上 各 出 现 一 次 ;[1,3] 区 间 的 数 分 子 上 出 现 一 次 而 分 母 上 出 现 两 次 。 根 据 这 一 规律 ,可 以 
编写 如 下 非常 高 效 的 组 合 数 计算 程序 。 
GEf Cni2 ni): 
if not (isinstance (n, int) and jsinstance (iint) and n>=): 
Print (n and i must be integers and n must be larger than or egqnal to i.') 
rebm 


resut 汪 
Min, Mex =sorted ( (i,n -i)) 
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for i in range (n,0, 11): 
if i AMEx: 
result* = 
elif i<=Min: 
result /3 
retim result 


print (ni2 (6,2)) 


Python 标准 库 itertools 提供 了 组 合 函 数 combinations( ) .排列 函数 permutations( ) .用 
于 循环 遍历 可 迭代 对 象 元 素 的 函数 cycle( ) ,根据 一 个 序列 的 值 对 另 一 个 序列 进行 过 滤 的 
函数 compress( ) ,根据 函数 返回 值 对 序列 进行 分 组 的 函数 groupby( ) .返回 包含 无 限 连续 
值 的 count 对 象 的 count 函数 ( ) .计算 笛 卡 儿 积 的 函数 product( ) 等。 下 面 的 代码 演示 了 
部 分 函数 的 用 法 。 

>>>inport itertools 

>>>for 让 in itertcols.ccnbinaticns (range (1,5),3): 姑 4 个 元 素 中 选 3 个 元 素 的 组 合 

print (it,end=" ') 
(1,2,3) (1,2,4) (1,3,4) C3,4) 


>>>list (itertools.permtations ([1,2,3,4],3)) 类 4 个 元 素 中 任 选 3 个 元 素 的 排列 
>>>x =itertools.penrmtations ([1,2,3,4],4) 要 个 元 素 的 全 排列 
>>>for i in range 5): 榆 出 前 5 个 排列 


Print next (x) ,end=" ') 
(1,2,3,4) (1,2,4,3) (1,3,2,4) (1,3,4,2) (1,4,2,3) 
>>>x ="'Private Fey"' 
>>>y =itertools.cycle (x) 御 环 遍历 序列 中 的 元 素 
>>>for i in range (20): 
Print (next (y) ,end=", ') 
PrFrirVrartvevrvEKrerYyrPrrrirVrartrerrKy 
>>>for i in range (5): 
Print (next (y) ,end=", ') 

eyrPri, 
>>>x =range (1,20) 
>>>y=(1,0) * 9+(,) 
>>>y 
(1,0,1,0,1,0,1,0,1,0,1,0,1,0,1,0,1,0,1) 
>>>1ist (itertools .ompress (x,y)) 扫 据 一 个 序列 的 值 ,对 另 一 个 序列 进行 过 滤 
SDL,19] 
>>>0ef grop (tv): 

if v>310: 

Tetbum 'greater than 10" 
elif v<5: 
Tetbum "less than 5" 
else: 
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retim ‘between 5 and 10" 

>>>x =range C0) 
>>>y =itertools.grorby (x, group) 好 序列 元 素 进行 分 组 
>>>fer Jov in y: 

print lo ':',1ist (Vv)) 
jess than 5 : [0,1,2,3,4] 
between 5 and 10 : [5,6,7,8,9,10] 
greater than 10 : [11,12,13,14,15,16,17,18,19] 
>>>x “itertools.cont (5,3) 息 始 值 为 5. 步 长 为 3 的 count 对 象 
>>>for i in range (10): 

Print (next (x) ,end=" ') 
581114172023262932 
>>>1ist (zip('abade', itertcols.comt ())) ount 对 象 中 的 元 素 个 数 是 无 穷 的 
[('a',0), (bd ('c',2), ('d',3), ('e',4)] 
>>>1ist (zip('abc', itertools.count ())) 
[('a',0), (b'sD), ('c',2)] 
>>>1ist (zip('abodefghi', itertools.oount ())) 
[('a',0), (bl), ('c',2), ('d',3), ('e',4), (£1,5), ('g',6), (h',7), (ri',8)] 
>>>for item in itertools.prodct ('abc', range (4)): 箱 卡 儿 积 

Print (itemend=" ') 
(Gad (Caly Cn.2) (na) (B10) Cb C55,2) CB,3) C0",0) CoD (en) (ea) 
>>>for item in itertools.prodict ('apc', "123v 'EC') : 

Print (itemend=" ') 
Car By Ca oy) (a2 Br) (a 2 C0) Va 3B) a3 OY (DAB) (PD 
W100) (br 2°,B') (P20C) (P31,B) (P31 0) (cl (cc (co 
i ey ne ey 
>>>finc =lanbda x:x.isnmeric() 
>>>1ist (itertools.takewhile (func, "1234abod')) 寻 滤 元 素 
[C123,"4°] 
>>>list (itertools.dropyhile (func, "1234abod') ) 
[a's D's cr, dG'] 


示例 4-6 ”编写 代码 ,模拟 决赛 现场 最 终 成 绩 的 计算 过 程 。 


















while True: 
try: 
n=int (input ("请 输入 评委 人 数 : )) 
ifn <2: 
print(' 评 委 人 数 太 少 ,必须 多 于 2 个 人 。') 
else: 
break 
except: 
pass 
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for i in rangen): 
页 个 while 循 环 用 来 保证 用 户 必须 输入 0~ 100 之 间 的 数字 
while True: 
try: 
score =input ("请 输入 第 {0} 个 评委 的 分 数 : ' .fomrat (i 匡 )) 
把 字 符 串 转换 为 实数 


score =Hoat (score) 
assert 0 <=soore < 本 00 
Soores.arpend (score) 
友 果 数据 人 台 法 ,跳出 while 循环 ,继续 输入 下 一 个 评委 的 分 数 
break 
Erospt: 
print(' 分 数 错误 ') 


寻 算 并 删除 最 高 分 与 最 低 分 
highest =mex (scores) 

lowest =min (scores) 

Scores.remove (highest) 

Scores.rermove (lowest) 

finalsoore =rond (sm(soores) /len (scores) ,2) 


fonratter =' 去 掉 一 个 最 高 分 {0} nn 去掉 一 个 最 低 分 全} n 最 后 得 分 {2}" 
Print (forratter. forrat (highest, lowest, finalsoore)) 
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帮 代码 复 用 技术 (一 ) : 函数 
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在 软件 开发 过 程 中 ,经 常 有 很 多 操作 是 完全 相同 或 者 是 非常 相似 的 ,仅仅 是 要 处 理 的 
数据 不 同 而 已 ,因此 经 常会 在 不 同 的 代码 位 置 多 次 执行 相似 甚至 完全 相同 的 代码 块 。 很 
显然 ,从 软件 设计 和 代码 复 用 的 角度 来 讲 , 直 接 将 代码 块 复制 到 多 个 相应 的 位 置 然 后 进行 
简单 修改 绝对 不 是 一 个 好 主意 。 虽 然 这 样 可 以 使 得 多 份 复制 的 代码 可 以 彼此 独立 地 进行 
修改 ,但 这 样 不仅 增 加 了 代码 量 ,也 增加 了 了 代码 阅读 .理解 和 维护 的 难度 ,为 代码 测试 和 纠 
错 带 来 很 大 的 困难 。 一 旦 被 复制 的 代码 块 将 来 某 天 被 发 现存 在 问题 而 需要 修改 ,必须 要 
对 所 有 的 复制 都 做 同样 的 正确 修改 ,这 在 实际 中 是 很 难 完成 的 一 项 任务 。 更 糟糕 的 情况 
是 ,由 于 代码 量 的 大 幅度 增加 ,导致 代码 之 间 的 关系 更 加 复杂 ,很 可 能 在 修补 旧 漏 洞 的 同 
时 又 引入 了 新 漏洞 ,维护 成 本 大 幅度 增加 。 因 此 ,应 尽量 减少 使 用 直接 复制 代码 的 方式 来 
实现 复 用 。 解 决 这 个 问题 的 有 效 方法 是 设计 函数 (function) 和 类 (class)。 本 章 介 绍 函 数 
的 设计 与 使 用 ,第 6 章 介 绍 面向 对 象 程序 设计 。 

将 可 能 需要 反复 执行 的 代码 封装 为 函数 ,然后 在 需要 该 功能 的 地 方 调用 封装 好 的 函 
数 , 不 仅 可 以 实现 代码 的 复 用 ,更 重要 的 是 可 以 保证 代码 的 一 致 性 ,只 需要 修改 该 函数 的 
代码 则 所 有 调用 位 置 均 得 到 体现 。 同 时 ,把 大 任务 拆 分 成 多 个 函数 也 是 分 治 法 的 经 典 应 
用 ,复杂 问题 简单 化 ,使 得 软件 开发 像 搭 积 木 一 样 简单 。 当 然 , 在 实际 开发 中 ,需要 对 函数 
进行 良好 的 设计 和 优化 才能 充分 发 挥 其 优势 .并 不 是 使 用 了 画 数 就 万 事 大 吉 了 。 在 编写 
函数 时 ,有 很 多 原则 需要 参考 和 遵守 ,例如 ,不 要 在 同一 个 函数 中 执行 太 多 的 功能 ,尽量 只 
让 其 完成 一 个 高 度 相 关 且 大 小 合适 的 功能 ,提高 模块 的 内 聚 性 。 另 外 ,尽量 减少 不 同 函 数 
之 间 的 隐 式 看 合 ,例如 ,减少 全 局 变量 的 使 用 ,使 得 冰 数 之 间 仅 通过 调用 和 参数 传递 来 显 
式 体现 其 相互 关系 。 再 就 是 设计 函数 时 应 尽量 减少 副作用 ,只 实现 指定 的 功能 就 可 以 了 ， 
不 要 做 多 余 的 事情 。 最 后 ,在 实际 项 目 开 发 中 ,往往 会 把 一 些 通用 的 函数 封装 到 一 个 模块 
中 ,并 把 这 个 通用 模块 文件 放 到 顶层 文件 夹 中 ,这 样 更 方便 管理 。 


5.1 函数 定义 与 使 用 


511 基本 语法 


在 Python 中 ,定义 函数 的 语法 如 下 : 
def 函数 名 ([ 参 数列 表 ]): 
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注释 呈 r 
函数 体 
在 Python 中 使 用 def 关键 字 来 定义 函数 ,然后 是 一 个 空格 和 函数 名 称 , 接 下 来 是 一 对 


括号 ,在 括号 内 是 形式 参数 列表 ,如 果 有 多 个 参数 则 使 用 逗号 分 隔 开 ,括号 之 后 是 一 个 冒 
号 和 换行 ,最 后 是 注释 和 函数 体 代 码 。 定 义 函 数 时 在 语法 上 需要 注意 的 问题 主要 有 : 四 
函数 形 参 不 需要 声明 其 类 型 ,也 不 需要 指定 函数 的 返回 值 类 型 ; @ 即 使 该 机 数 不 需要 接 
收 任何 参数 ,也 必须 保留 一 对 空 的 括号 ; 图 括号 后 面 的 冒号 必 不 可 少 ; @@ 函 数 体 相对 于 
def 关键 字 必 须 保持 一 定 的 空格 缩 进 。 


下 面 的 函数 用 来 计算 斐 波 那 契 数 列 中 小 于 参数 n 的 所 有 值 : 


GEf fb): 证 义 函 数 ,括号 里 的 n 是 形 参 
Taccept an integer n. 
Tetum the nmbers less than n in Fibonacci ssqnence. 
abl 
whileaan: 
Print (a,end=" ') 
arb=p/atb 
Print () 
该 函数 的 调用 方式 为 
fib (000) 崎 用 函数 ,括号 里 的 1000 是 实 参 
如 果 代 码 本 身 不 能 提供 非常 好 的 可 读 性 ,那么 最 好 加 上 适当 的 注释 来 说 明 。 在 定义 


函数 时 ,开头 部 分 的 注释 并 不 是 必需 的 ,但 是 如 果 为 函数 的 定义 加 上 一 段 注释 的 话 , 可 以 
为 用 户 提供 友好 的 提示 和 使 用 帮助 。 例 如 ,可 以 使 用 内 置 函 数 help( ) 来 查看 函数 的 使 用 
帮助 ,并 且 在 调用 该 函数 时 输入 左 侧 圆 括号 之 后 ,立刻 就 会 得 到 该 函数 的 使 用 说 明 , 如 
图 5-1 所 示 。 





TFTEUT 
accept an integer n. ee 
n the numbers less than n in Fibonacci sequence. 














a » 
while a < n: 
print (a ende” “) 


We 
Print () 







>>> print (fib.__doc__) 

accept an integer mr 
return the nunbers less than n in Fibonacci sequence. 

>>> help(fib) 

Help on function fib in nodule nain_: 





ibm 
accept an integer n. 
return the nunbers less than n in Fibonacci sequence. 


>>> fibd 
(nn) 




















accept an integer n. 
return the nunbers less than n in Fibonacci sequence. 





图 5-1 使 用 注释 来 为 用 户 提示 函数 使 用 说 明 
在 Python 中 ,定义 函数 时 也 不 需要 声明 函数 的 返回 值 类 型 ,而 是 使 用 return 语句 结束 


函数 执行 的 同时 返回 任意 类 型 的 值 ,函数 返回 值 类 型 与 return 语句 返回 表达 式 的 类 型 一 
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致 。 不 论 return 语句 出 现在 函数 的 什么 位 置 ,一 旦 得 到 执行 将 直接 结束 函数 的 执行 。 如 
果 函 数 没 有 return 语句 有 return 语句 但 是 没有 执行 到 或 者 执行 了 不 返回 任何 值 的 return 
语句 ,解释 器 都 会 认为 该 函数 以 return None 结束 , 即 返回 空 值 。 

在 编写 函数 时 ,应 尽量 减少 副作用 ,尽量 不 要 修改 参数 本 身 , 不 要 修改 除 返回 值 以 外 
的 其 他 内 容 。 另 外 ,应 充分 利用 Python 函数 式 编程 的 特点 ,让 自己 定义 的 函数 尽量 符合 
纯 函 数 式 编程 的 要 求 ,例如 ,保证 线程 安全 、 可 以 并 行 运 行 等 。 


512 函数 内 套 定义 、 可 调用 对 象 与 修饰 器 


1. 函数 入 套 定义 
Python 允许 函数 的 幅 套 定义 ,在 函数 内 部 可 以 再 定义 另外 一 个 函数 。 在 2.4 节 有 一 
段 代 码 是 用 来 实现 可 迭代 对 象 与 数字 四 则 运算 的 ,当时 是 使 用 lambda 表达 式 实现 的 主要 
功能 ,如 果 使 用 函数 嵌 套 定义 的 话 ,代码 可 以 写作 : 
>>>cef mryMep (iterable,apyvalue) : 相 定 义 函 数 
if pnt in t+-*/": 
retim ‘'Error qperatior' 


Gef nested (item : 根 套 定义 函数 
Tebum eval (repr (item) +cp +repr (value)) 
retum rep (nested iteraple) 症 用 在 函数 内 部 定义 的 函数 
>>>list (ryMep (range (5), ' +',5)) 调用 外 部 函数 ,不 需要 关心 其 内 部 实现 
[5,6,7,8,9] 


>>>1ist (ryMap (range (5), ' —',5)) 
[5, 4, 3, 2, 4] 
>>>1ist (ryMap (range (5), ' * ',5)) 
[0,5,10,15,20] 
>>>1ist (ryMap (range (5), '/',5)) 
[0.0,0.2,0.4,0.6,0.8] 


下 面 的 函数 利用 函数 租 套 定义 和 递归 实现 帕斯卡 公式 C(n,i) =C(n -1,i)+C(n- 
1, i 一 1) ,进行 组 合 数 C(n,i) 的 快速 求解 。 


def Dn,i): 
cache2 dict () 


Gef fm,i): 
ifn==i ori==0: 
Tetom 工 
elif (n,i) mot in cache2: 
cache2 [tn,i)] =En1,i) nn,i 1) 
retim cache2[ (n,i)] 


retum fn,i) 
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尽管 函数 戏 套 定义 使 用 很 方便 ,也 很 灵活 ,但 是 并 不 提倡 过 多 使 用 ,因为 这 样 会 导致 
内 部 的 函数 反复 定义 而 影响 执行 效率 。 


2. 可 调用 对 象 


函数 属于 Python 可 调用 对 象 之 一 ,由 于 构造 方法 的 存在 ,类 也 是 可 调用 的 。 像 list( ) 、 
tuple( ) ,dict( ) ,set( ) 这 样 的 工厂 函数 实际 上 都 是 调用 了 类 的 构造 方法 。 另 外 ,任何 包含 
call__( ) 方 法 的 类 的 对 象 也 是 可 调用 的 。 下 面 的 代码 使 用 函数 的 内 套 定义 实现 了 可 调 
用 对 象 的 定义 : 
Gef linear (a,b): 
GEf result Co : 寿 Eythcn 中 ,函数 是 可 以 嵌 套 定义 的 
rebma*r tp 
retim result 贱 回 可 被 调用 的 函数 
下 面 的 代码 演示 了 可 调用 对 象 类 的 定义 : 
class linear: 
Gf __init _(self,a,b): 
self.a,self.bp=a,b 
cef __cal (self,x): 凡 里 是 关键 
Tetbmm self.a* x +self.b 
使 用 上 面 的 谋 套 函数 和 类 这 两 种 方式 中 任何 一 个 ,都 可 以 通过 以 下 的 方式 来 定义 一 
个 可 调用 对 象 : 
tames =linear (0.3,2) 
然后 通过 下 面 的 方式 来 调用 该 对 象 : 


taxes (5) 


3. 修饰 器 


修饰 器 (decorator) 是 函数 骨 套 定义 的 另 一 个 重要 应 用 。 修 饰 嚣 本质 上 也 是 一 个 函 
数 , 只 不 过 这 个 函数 接收 其 他 函数 作为 参数 并 对 其 进行 一 定 的 改造 之 后 返回 新 函数 。 后 
面 第 6 章 中 的 静态 方法 .类 方法 .属性 等 也 都 是 通过 修饰 器 实现 的 ,Python 中 还 有 很 多 这 
样 的 用 法 。 下 面 的 代码 演示 了 修饰 器 的 定义 与 使 用 方法 ,定义 其 他 函数 调用 之 前 或 之 后 
需要 执行 的 通用 代码 ,可 作用 于 其 他 任何 函数 ,提高 代码 复 用 度 。 


GEf before (func) : 证 义 修饰 器 
GEfE wrapper ("args, *wargs) : 
Print ('Before foncticn called. ') 
retim fonc (*args, +**wargs) 
retum wrapper 


GEf after (func) : 证 义 修饰 器 
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CEf wrapper (args, *wargs) : 
Heoult inc (# angs, * s jars) 
Print ('After functian called. ') 
retim result 

reim wrapper 


@ before 

@after 

GEf test (): 后 时 使 用 两 个 修饰 器 改造 函数 
Print (3) 

租用 被 修饰 的 函数 

test () 


和 预想 的 完全 一 样 ,上 面 代码 的 运行 结果 为 


Before fmcticn called. 
3 
After fmcticn called. 


下 面 的 代码 通过 定义 和 使 用 修饰 器 有 效 复 用 了 用 户 名 检查 功能 的 代码 ,关于 面向 对 
象 编程 的 知识 请 参考 第 6 章 。 


GEf heck pemissian (fanc) : 
GEf wrapper ("args, **kwargs) : 
if kwargs.get (usermare") ! ='acmin': 
raise Exoeptian ('Sorry。Ycu are not allowed.') 
retim fonc (args, *wargs) 
retim wrapper 


class ReaWriteFile (Goject) : 
由 函数 sheck Permissicn 作为 装饰 器 使 用 
@ check Permissicn 
GEf reeqi(self,usermare filename) : 
Tetum cpen (filename, 'r') .read() 


GEf write (self, usemene, filename, ontent) : 
cpen (filenamey 'a+') -write (ontent) 

把 函数 sheck Permissicn 作为 普通 函数 使 用 

write =check Permissicn (write) 


七 eacinriteFile (0) 

Print (OriginallY … ') 

Print 比 .read (usemere 一 'adnin' filenare 一 'd: \sanple.txt')) 

Print ('Now,try to write to a file…') 

t.write (sermame ="'adin', filenare =r"d: \sanple.tit', ontent =" \nhello world') 
Print ('After calling to write…') 
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Print (t .read (usemame ='admin', Filenare =7'd: \sanple.txt")) 


下 面 的 代码 使 用 修饰 器 对 函数 进行 改写 ,使 用 字典 存储 临时 结果 ,避免 了 重复 计算 ， 
从 而 提高 了 代码 的 执行 效率 ,并 且 有 效 避 免 了 因为 递归 深度 过 深 而 导致 的 内 存 不 足 。 然 
后 使 用 修饰 器 定义 了 函数 3( ) ,使 用 帕斯卡 公式 快速 求解 组 合 数 ,与 本 节 开 始 提 到 的 嵌 
套 函 数 的 例子 具有 相同 的 功能 ,但 是 效率 更 高 一 些 。 


fram finctools import wraps 


证 义 修饰 器 
GEf cacheaGFunc (fnc) : 
策 用 字典 存储 中 间 结 果 
cache dict () 
寻 目 标 函数 进行 改写 
@ wraps (fonc) 
GEf newEunc (sargs): 
if args ct in cache: 
cache[args] =finc ( *args) 
retum cache [args] 
版 回 修改 过 的 新 函数 


Tetum Bn-,i) +Bm1,i71) 

同样 的 修饰 器 也 适用 于 斐 波 那 契 数列 的 递归 求解 函数 。 

@ chedeinc 

Cef fibl (i): 

ifi<Q: 
rebm1 
Tetum fihl (i 1) +Eibl (i 2) 

为 了 实现 上 述 功 能 ,Python 标准 库 functools 提供 了 一 个 缓存 修饰 器 lru_cache, 可 以 大 
幅度 提高 代码 的 性 能 ,其 中 的 参数 maxsize 用 来 限制 缓存 的 条 目 数 量 , 当 缓存 的 条 目 数 达 
到 最 大 时 会 自动 删除 最 近 最 少 使 用 的 条 目 。 例 如 下 面 的 代码 , 比 使 用 上 面 的 修饰 器 效果 
要 好 很 多 。 

inport fimctools 

@ fimctools.lru cache traxsize =64) 

def fA ni): 


if n==3i ori=30: 
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rebm1 
retm 级 ,了 +f4m1,i71) 


513 函数 对 象 成 员 的 动态 性 


正如 第 1 章 所 说 ,Python 是 一 种 高 级 动态 编程 语言 ,变量 类 型 是 随时 可 以 改变 的 。 
Python 中 的 函数 和 自 定义 对 象 的 成 员 也 是 可 以 随时 发 生 改 变 的 ,可 以 为 函数 和 自 定义 对 
象 动态 增加 新 成 员 。 本 节 介 绍 函 数 的 动态 性 ,第 6 章 再 介绍 自 定 义 对 象 的 动态 性 。 


>>>def finc 0) : 
Print (func.x) 桂 看 函数 fanc 的 成 员 x 
>>>finc() 现在 函数 fmc 还 没有 成 员 x, 出 错 
对 tributeprror: ,fancticn' cbject has no attripute x" 
>>>fanc.x=3 山 态 为 函数 增加 新 成 员 
>>>finc() 
3 
>>>finc.x 首 外 部 也 可 以 直接 访问 函数 的 成 员 
3 
>>>ael fimc.x 删除 函数 成 员 
>>>finc() 删除 之 后 不 可 访问 
对 tributeprror: ,fancticn' cbject has mo attripute x 
514 函数 递归 调用 


函数 的 递归 调用 是 函数 调用 的 一 种 特殊 情况 ,函数 调用 自己 ,自己 再 调用 自己 ,自己 
再 调用 自己 …… , 当 某 个 条 件 得 到 满足 的 时 候 就 不 再 调用 了 ,然后 再 一 层 一 层 地 返回 直到 
该 函数 的 第 一 次 调用 ,如 图 5-2 所 示 。 























函数 A 函数 B 。 函数 B ”函数 B 函数 B 。 函数 B 
调用 
4 调用 | 调用 | 调用 调用 | 调用 
\ I/ 1 We ' ' 
i 
返回 | 返回 | 返回 返回 ”| 返回 


图 52 ”函数 递归 调用 示意 图 


函数 递归 通常 用 来 把 一 个 大 型 的 复杂 问题 层 层 转 化 为 一 个 与 原来 问题 本 质 相同 但 规 
模 很 小 、 很 容易 解决 或 描述 的 问题 ,只 需要 很 少 的 代码 就 可 以 描述 解决 问题 过 程 中 需要 的 
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大 量 重复 计算 。 下 面 的 代码 使 用 递归 计算 列表 中 所 有 元 素 之 和 ,尽管 在 Python 没有 这 样 
做 的 必要 。 


Tetbmm 1st[0] +recursivesm(1st[1:]) 
而 下 面 的 代码 则 使 用 递归 实现 了 整数 的 因数 分 解 ,函数 执行 结束 后 ,fac 中 包含 了 整 
数 num 因数 分 解 的 结果 。 


fram randam inrport randint 





GEf factors (um, fac =[]): 
上 每 次 都 从 2 开始 查找 因数 
for i in range CB,int (Mm*0.5) 1): 
夏 到 一 个 因数 
if mm i==0: 
fac.arpend(i) 
寻 商 继续 分 解 ,重复 这 个 过 程 
factors um/i, fac) 
性 意 ,这 个 break 非 常 重要 
break 
else: 
坏 可 分 解 了 ,自身 也 是 个 因数 
fac.append (num) 


facs =[] 

n=randint 2,10 **8) 

factors (n, facs) 

result =" * ' .join trep (str, facs)) 

if n==eval (result): 

Erint tn, ' =" +result) 

最 后 ,从 图 5-2 中 可 以 看 出 ,每 次 调用 晴 数 时 必须 要 记 住 离开 的 位 置 才能 保证 函数 运 
行 结束 以 后 回 到 正确 的 位 置 ,这 个 过 程 称 为 保存 现场 ,这 需要 一 定 的 栈 空 间 。 另 外 ,调用 
一 个 函数 时 会 为 该 函数 分 配 一 个 栈 帧 ,用 来 存放 普通 参数 和 函数 内 部 局 部 变量 的 值 ,这 个 
栈 帧 会 在 函数 调用 结束 后 自动 释放 。 而 在 函数 递归 调用 的 情况 中 ,一 个 函数 执行 尚未 结 
束 就 又 调用 了 自己 ,原来 的 栈 帧 还 没 释放 又 分 配 了 新 栈 帧 ,会 占用 大 量 的 栈 空间 。 因 此 ， 
递归 深度 如 果 太 大 的 话 , 可 能 会 导致 栈 空 间 不 足 进 而 导致 程序 崩溃 。 


5.2 函数 参数 


函数 定义 时 括号 内 是 使 用 逗号 分 隔 开 的 形 参 列表 ( parameters ) ,函数 可 以 有 多 个 参 
数 ,也 可 以 没有 和 参数 ,但 定义 和 调用 时 一 对 括号 必须 要 有 ,表示 这 是 一 个 函数 并 且 不 接收 
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参数 。 调 用 函数 时 向 其 传递 实 参 ( arguments) ,根据 不 同 的 参数 类 型 ,将 实 参 的 值 或 引用 
传递 给 形 参 。 定 义 函 数 时 不 需要 声明 参数 类 型 ,解释 器 会 根据 实 参 的 类 型 自动 推断 形 参 
类 型 ,在 一 定 程度 上 类 似 于 函数 重 载 和 泛 型 函数 的 功能 。 

一 般 来 说 ,在 函数 内 部 直接 修改 形 参 的 值 不 会 影响 实 参 。 例 如 : 


>>>Gef adione (a) : 
己 + 村 琢 条 语句 会 得 到 一 个 新 的 变量 a 
>>>a33 
>>>eacbpne (a) 
>>>a 竹 参 的 值 没有 受到 影响 


3 


从 运行 结果 可 以 看 出 ,在 函数 内 部 修改 了 形 参 a 的 值 , 但 是 当 函 数 运行 结束 以 后 , 实 
参 a 的 值 并 没有 被 修改 。 然 而 ,列表 、 字 典 、 集 合 这 样 的 可 变 序列 类 型 作为 函数 参数 时 ,如 
果 在 函数 内 部 通过 列表 、 字 典 或 集合 对 象 自身 的 方法 修改 参数 中 的 元 素 时 ,同样 的 作用 也 
会 体现 到 实 参 上 。 


>>>aef modify (v) : 月 改 列表 元 素 值 
V[0] vy[0] 世 

>>>a=[2] 

>>>rodify (a) 

>>>a 

[3] 

>>>cef rodify (v, item) : 肉 列 表 增 加 元 素 
V.append (item) 

>>>a=[2] 

>>>modify (a,3) 

>>>a 

[2,3] 

>>>Gef modify (9) : 政 改 字典 元 素 值 或 为 字典 增加 元 素 
d['age'] 38 

>>>a ={ hame': ‘Dang', 'age' :37, 'sex' : "Male'} 

>>>modify (a) 

>>>a 

{'age': 38, name': 'Dong', 'sex': 'Male'} 

>>>aef modify(s,v) : 其 集合 添加 元 素 
5.add(v) 

>>>s ={1,2,3} 

>>>nodify (s,4) 

>>>s 

{1,2,3,4} 


也 就 是 说 ,如 果 传 递 给 函数 的 是 列表 字典、 集合 或 其 他 自 定义 的 可 变 序列 ,并 且 在 了 
数 内 部 使 用 下 标 或 序列 自身 支持 的 方式 为 可 变 序 列 增加 、 删 除 元 素 或 修改 元 素 值 时 ,修改 
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后 的 结果 是 可 以 反映 到 函数 之 外 的 , 即 实 参 也 得 到 了 相应 的 修改 。 

第 2 章 和 第 3 章 曾经 多 次 提 到 ,Python 采用 的 是 基于 值 的 自动 内 存 管理 模式 ,变量 并 
不 直接 存储 值 ,而 是 存储 值 的 引用 。 从 这 个 角度 来 讲 ,在 Python 中 调用 函数 时 , 实 参 到 形 
参 都 是 传递 的 引用 。 也 就 是 说 ,Python 函数 不 存在 传 值 调用 。 


521 位 置 参 数 


位 置 参数 (positional arguments) 是 比较 常用 的 形式 ,调用 丽 数 时 实 参 和 形 参 的 顺序 必 
须 严 格 一 致 ,并 且 实 参 和 形 参 的 数量 必须 相同 。 


>>>aef dam (abyc) : 新 有 形 参 都 是 位 置 参 数 
Print (a,b,c) 

>>>Gemp (3,4,5) 

345 

>>>Germp (3,5,4) 

354 

>>>danp (1,2,3,4) 镑 参与 形 参 的 数量 必须 相同 

TypeError: Gemp () takes 3 Positicnal arguments but 4 were given 


522 默认 值 参 数 


在 定义 函数 时 ,Python 支持 默认 值 参 数 , 在 定义 函数 时 可 以 为 形 参 设置 默认 值 。 在 调 
用 带 有 默认 值 参数 的 函数 时 ,可 以 不 用 为 设置 了 默认 值 的 形 参 进行 传 值 ,此 时 函数 将 会 直 
接 使 用 函数 定义 时 设置 的 默认 值 , 当 然 也 可 以 通过 显 式 赋值 来 替换 其 默认 值 。 也 就 是 说 ， 
在 调用 函数 时 是 否 为 默认 值 参数 传递 实 参 是 可 选 的 ,具有 较 大 的 灵活 性 ,在 一 定 程度 上 类 
似 于 函数 重 载 的 功能 ,同时 还 能 在 为 函数 增加 新 的 参数 和 功能 时 通过 为 新 参数 设置 默认 
值 来 保证 向 后 兼容 而 不 影响 老 用 户 的 使 用 。 需 要 注意 的 是 ,在 定义 带 有 默认 值 参 数 的 函 
数 时 ,任何 一 个 默认 值 参 数 右边 都 不 能 再 出 现 没 有 默认 值 的 普通 位 置 参数 ,否则 会 提示 语 
法 错误 。 带 有 默认 值 参 数 的 函数 定义 语法 如 下 : 
def 函数 名 (…, 形 参 名 -默认 值 ): 
函数 体 
可 以 使 用 “函数 名 . defaults_“" 随 时 查看 函数 所 有 默认 值 参 数 的 当前 值 ,其 返回 值 
为 一 个 元 组 ,其 中 的 元 素 依 次 表示 每 个 默认 值 参 数 的 当前 值 。 
>>>aef say( message, times 1 ) : 
Print (essage +' ') * times) 
>>>say. _defaults _ 
Q,) 
调用 该 函数 时 ,如 果 只 为 第 一 个 参数 传递 实 参 , 则 第 二 个 参数 使 用 默认 值 1, 如果 为 
第 二 个 参数 传递 实 参 , 则 不 再 使 用 默认 值 1 ,而 是 使 用 调用 者 显 式 传递 的 值 。 
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>>>say ('hello') 

hello 

>>>say(hellov3) 

hello hello hello 

多 次 调用 函数 并 且 不 为 默认 值 参数 传递 值 时 ,默认 值 参数 只 在 定义 时 进行 一 次 解释 
和 初始 化 ,对 于 列表 .字典 这 样 可 变 类 型 的 默认 值 参 数 ,这 一 点 可 能 会 导致 很 严重 的 逻辑 
错误 ,而 这 种 错误 或 许 会 耗费 大 量 精力 来 定位 和 纠正 。 


>>>aef de (newitem,old 1ist=[]): 
old list.append newitem) 
retum old list 


>>>print (Garo('5", [1,2,3,4])) 

[1,2,3,4,'5°"] 

>>>print (Garo ('asa', ['a', b'])) 

['a', b', ‘asa'] 

>>>print (daro('a')) 

['a'] 

>>>print (Ga ('b')) 考 意 这 里 的 输出 结果 

[av b'] 

上 面 的 函数 使 用 列表 作为 默认 参数 ,由 于 其 可 记忆 性 ,连续 多 次 调用 该 函数 而 不 给 该 
参数 传 值 时 ,再 次 调用 时 将 保留 上 一 次 调用 的 结果 。 一 般 来 说 ,要 避免 使 用 列表 .字典 . 集 
合 或 其 他 可 变 序 列 作 为 函数 参数 默认 值 ,对 于 上 面 的 函数 ,更 建议 使 用 下 面 的 写法 。 


def daro (newitem, old list one) : 
if old list is None: 
old list =[] 
old list.append (newitem) 
retm cold list 
另外 一 个 需要 注意 的 问题 是 ,如 果 在 定义 函数 时 某 个 参数 的 默认 值 为 男 一 个 变量 的 
值 ,那么 参数 的 默认 值 只 依赖 于 函数 定义 时 该 变量 的 值 ,或 者 说 函数 的 默认 值 参 数 是 在 函 
数 定义 时 确定 值 的 ,所 以 只 会 被 初始 化 一 次 。 例 如 : 
>>>i aa 
>>>aef fm=i): 雁 数 n 的 值 仅 取 决 于 圭 的 当前 值 
print (n) 
>>>£() 
舍 
>> 习 二 
>>>£() 
Ei 
>>>i 


萎 数 定义 后 修改 二 的 值 不 影响 参数 n 的 默认 值 


>>>£() 
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和 
>>>aef fm=i): 重新 定义 函数 


523 关键 参数 


关键 参数 主要 指 调用 孔 数 时 的 参数 传递 方式 ,与 函数 定义 无 关 。 通 过 关键 参数 可 以 
按 参 数 名 字 传 递 值 ,明确 指定 哪个 值 传递 给 哪个 参数 , 实 参 顺序 可 以 和 形 参 顺序 不 一 致 ， 
但 不 影响 参数 值 的 传递 结果 ,避免 了 用 户 需 要 牢记 参数 位 置 和 顺序 的 麻烦 ,使 得 函数 的 调 
用 和 参数 传递 更 加 灵活 方便 。 


>>>Gef Gemp (a,b,c 565): 
Print (a,b,c) 
>>>danD (3,7) 碗 位 置 传递 参数 
375 
>>>danp(c 38,a 3,b=0) 嵌 键 参数 
908 


524 可 变 长 度 参数 


可 变 长 度 参 数 在 定义 函数 时 主要 有 两 种 形式 : sparameter 和 *sparameter, 前 者 用 来 接 
收 任意 多 个 实 参 并 将 其 放 在 一 个 元 组 中 ,后 者 接收 类 似 于 关键 参数 一 样 显 式 赋值 形式 的 
多 个 实 参 并 将 其 放 入 字典 中 。 

下 面 的 代码 演示 了 第 一 种 形式 可 变 长 度 参 数 的 用 法 ,无 论调 用 该 函数 时 传递 了 多 少 
实 参 ,一 律 将 其 放 入 元 组 中 : 


>>>Gef denp( PP): 
Print (p) 

>>>Gerp (1,2,3) 

(2,3) 

>>>aemo (1,2,3,4,5,6,7) 

(1,2,3,4,5,6,7) 


下 面 的 代码 演示 了 第 二 种 形式 可 变 长 度 参 数 的 用 法 , 即 在 调用 该 函数 时 自动 将 接收 
的 参数 转换 为 字典 : 


>>>Gef Gemp (*P) : 
for item in p.items 0: 
print (item) 
>>>Gemp (Ky 2,z 3) 
('y',2) 
(‘x"',1) 
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(C21,3) 
在 函数 定义 中 增加 一 些 外 围 的 检查 代码 ,可 以 防止 用 户 调用 函数 时 传人 无 效 参 数 。 


>>>Gef Gemp (a,b, *wargs) : 
for para in Kwargs .keys () : 
柚 人 允许 传人 xYz 这 样 的 关键 参数 
if para not in (‘x','y','2"): 
raise Eoeptioan ('{0} is not a valid parameter" .fomat (para)) 
Print (a tb +sm(Wwargs .values ())) 
>>>dano(1,2) 林 以 不 给 wargs 传 值 ,默认 为 空 字典 
3 
>>>9GanD(1,2,x 3) 


6 
>>>dano (1,2, x3) 本 接收 这样 的 参数 名 


Exosptian: x is not a valid paramreter 

了 Python 定义 函数 时 可 以 同时 使 用 位 置 参 数 、 关 键 参数 .默认 值 参 数 和 可 变 长 度 参数 ， 
但 是 除非 真 的 很 必要 ,否则 不 要 这 样 做 ,因为 这 会 使 得 代码 非常 混乱 而 严重 降低 可 读 性 ， 
并 导致 程序 查 错 非常 困难 。 另 外 ,一 般 而 言 ,一 个 函数 如 果 可 以 接收 很 多 不 同类 型 参数 的 
话 , 很 可 能 是 函数 设计 得 不 好 ,例如 函数 功能 过 多 ,需要 进行 必要 的 拆 分 和 重新 设计 ,以 满 
足 模块 高 内 聚 的 要 求 。 


525 强制 函数 的 某 些 参数 必须 以 关键 参数 形式 进行 传 什 


在 函数 定义 时 ,位 于 * parameter 或 单独 一 个 星 号 * 之 后 的 所 有 参数 都 只 能 以 关键 参 
数 的 形式 进行 传 值 ,不 接收 其 他 任何 形式 的 传 值 。 


>>>aef dep (avby * vc) : 众 数 < 必须 以 关键 参数 进行 传 值 
Print (a tp +c) 
>>>danop (1,2,c 33) 手 确 
6 
>>>aemp (1,2,3) 皇 误 ,引发 异常 
Typeerror: Gemp () takes 2 Positicnal arguments but 3 were given 
>>>Gef demp (avby pyc) : 耸 数 < 必须 以 关键 参数 进行 传 值 
Prirtatb+c+sme)) 
>>>dempd,2,3v4v,c<5) 年 确 
5 
>>>cemp (1,2,3,4,5) 重 误 ,引发 异常 


TypeError: dew() missing 1 required keyword -cnly argument: 'c' 
如 果 需 要 强制 函数 的 所 有 参数 都 必须 以 关键 参数 形式 进行 传 值 ,可 以 在 定义 函数 时 
把 单独 一 个 星 号 * 作为 函数 第 一 个 参数 。 例 如 : 


>>>Gef demp(* varb) : 
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Print (a,b) 
>>>daro (a1,b 2) 
生效 
>>>aeamp (1,2) 
TypeError: damp() takes 0 positicnal arguments Put 2 were given 


也 可 以 使 用 修饰 器 实现 同样 的 功能 ,下 面 的 代码 首先 定义 了 一 个 修饰 器 对 函数 的 关 
键 参 数 和 位 置 参 数 进行 检查 ,如 果 发 现 有 参数 没有 以 关键 参数 形式 传 值 则 抛 出 异常 。 


GEf mustBsFeywords (func) : 


jmport inspect 
页 取 位 置 参 数 和 默认 值 参 数列 表 
Positions =inspect .getargspec (Enc) .args 
CEf wrapper ("args, **kwargs) : 
for Pos in Positicns: 
if pos not in kwargs: 
raise Excepticn (pos +' must be keyword parameter') 
retim finc ("args, *wargs) 
retim wrapper 


@ mstBereywords 
Gef demp (abyc) : 
Print (a,b,c) 


526 强制 函数 的 所 有 参数 必须 以 位 置 参数 形式 进行 传 什 


在 2.4 节 曾 经 提 到 ,内 置 函数 sum( ) 强制 要 求 参 数 必须 按 位 置 进行 传 值 而 不 允许 使 
用 关键 参数 的 形式 ,使 用 help( ) 查看 帮助 文档 的 话 会 发 现 sum( ) 函数 的 最 后 一 个 参数 是 
和 斜 线 。 那 是 Argument Clinic 的 设计 ,与 底层 C 语言 实现 有 关 , 在 Python 中 定义 函数 时 不 
允许 使 用 斜 线 作 为 函数 参数 。 尽 管 不 允许 使 用 斜 线 作为 参数 ,但 是 通过 修饰 器 也 可 以 实 
现 同样 的 效果 。 例 如 下 面 的 代码 ,首先 定义 了 一 个 修饰 器 对 函数 的 位 置 参 数 和 关键 参数 
进行 检查 ,如 果 发 现 有 关键 参数 与 位 置 参 数 同名 则 抛 出 异常 。 


GEf cnlyPcsiticns (fonc) : 
jmport inspect 
父 取 函数 fanc 的 位 置 参数 列表 
Positicns =inspect .getargspec (func) .args 
CEf wrapper ("args, *wargs) : 
检查 关键 参数 列表 
for para in Wwargs: 
if Para in positicns: 
raise Esption (para +"' can not be keyword Parameter ) 
retim finc (args, *wargs) 
rebim wraper 
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@ nlyPositions 
def da (asb,o) : 
Erint arbyc) 


527 传递 参数 时 的 序列 解 包 


与 可 变 长 度 的 参数 相反 ,这 里 的 序列 解 包 是 指 实 参 , 同 样 也 有 * 和 *: 丁 种 形式 。 调 用 
含有 多 个 位 置 参 数 (positional arguments ) 的 函数 时 ,可 以 使 用 Python 列表 .元 组 、 集 合 、 字 
典 以 及 其 他 可 和 迭代 对 象 作为 实 参 , 并 在 实 参 名 称 前 加 一 个 星 号 ,Python 解释 器 将 自动 进行 
解 包 ,然后 把 序列 中 的 值 分 别传 递 给 多 个 单 变 量 形 参 。 


>>>Gef Gemp (arbyc) : 
print (a tb +c) 

>>>seq=[1,2,3] 

>>>Gemp ( :Seg) 

6 
>>>tp=(,2,3) 
>>>GanD (Pp) 

6 
>>>dic={1:'a',2:'b',3:'c'} 
>>>Ganrp (dic) 

6 
>>>Gemp (xcic.vealues ()) 
abc 
>>>Set ={1,2,3} 
>>>Gemp ( xEet) 

6 


是 以 接收 多 个 位 置 参数 的 函数 


峙 列表 进行 解 包 


峙 元 组 进行 解 包 


寻 字 典 的 键 进行 解 包 


寻 字 典 的 值 进行 解 包 


寻 集 合 进行 解 包 


如 果实 参 是 个 字典 ,可 以 使 用 两 个 星 号 * 对 其 进行 解 包 , 会 把 字典 转换 成 类 似 于 关键 
参数 的 形式 进行 参数 传递 。 对 于 这 种 形式 的 序列 解 包 , 要 求实 参 字 典 中 的 所 有 键 都 必 且 
是 函数 的 形 参 名 称 , 或 者 与 函数 中 两 个 星 号 的 可 变 长 度 参 数 相 对 应 。 


>>>p={'a':l, b':2, 'c':3} 
>>>Gef f(a,b,c—5): 
Print (a,b,c) 
>>>£ (**p) 
| 
>>>aef f(a3,pA,c—5): 
Print (a,b,c) 
>>>£ (**p) 
生 虽 3 
>>>Gef Gemp (*P) : 
for item in p.itars 0 : 
Print (item) 


醒 解 包 的 字典 
嵌 有 位 置 参 数 和 默认 值 参 数 的 丽 数 


大 有 多 个 默认 值 参数 的 函数 
财 字 典 元 素 进行 解 包 


粮 收 字典 形式 可 变 长 度 参数 的 函数 
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>>>p={"x" :1, 'y':2,'2':3} 

>>>Gemp (*P) 财 字 典 元 素 进行 解 包 

('y',2) 

('z"',3) 

("x',1) 

如 果 一 个 函数 需要 以 多 种 形式 来 接收 参数 ,定义 时 一 般 把 位 置 参数 放 在 最 前 面 ,然后 
是 默认 值 参数 , 接 下 来 是 一 个 星 号 的 可 变 长 度 参 数 ,最 后 是 两 个 星 号 的 可 变 长 度 参数 ; 调 
用 函数 时 ,一 般 也 按照 这 个 顺序 进行 参数 传递 。 调 用 了 晴 数 时 如 果 对 实 参 使 用 一 个 星 号 * 
进行 序列 解 包 ,那么 这 些 解 包 后 的 实 参 将 会 被 当 作 普通 位 置 参 数 对 待 ,并 且 会 在 关键 参数 
和 使 用 两 个 星 号 ** 进行 序列 解 包 的 参数 之 前 进行 处 理 。 


>>>Gef dep (asb,o) : 证 义 函 数 
Erint (arbyrc) 
>>>Gemp (*(Lv273)) 笛 用 ,序列 解 包 
123 
>>>cemp (1, *C,3)) 柱 置 参数 和 序列 解 包 同 时 使 用 
E23 
>>>aemp (1, *C,)v3) 
123 
>>>Gemp (a *C,3)) #- 个 星 号 的 序列 解 包 相 当 于 位 置 参数 
乱 先 处 理 ,引发 异常 
TypeError: Geam() got mltiple values for argment ‘a' 


>>>Garp Pb, *C,3)) 重复 给 b 赋 值 ,引发 异常 

TypeError: cam() got rultiple values for argurent 'b' 

>>>dano(c3, #2,3)) #- 个 星 号 的 序列 解 包 相当 于 位 惫 参数 
乱 先 处 理 

这 当 时 

>>>Gemp(*H a:l, b':2}, * GB,)) 疗 列 解 包 不 能 在 关键 参数 解 包 之 后 

SyntaxError: iterable argurent urpacking follows keyword argment urpacking 

>>>Gno(*GB,), *'a':l, Db' :2)) #- 个 星 号 的 序列 解 包 相当 于 位 兽人 参数 


需 先 处 理 ,引发 异常 
TypeError: dam() got miltiple values for argment ‘a' 
>>>aemp(*G,)，*sfcr3ly bo:2]) 
321 


528 标注 函数 参数 与 返回 值 类 型 


虽然 Python 是 一 种 强 类 型 语言 ,但 它 并 不 允许 直接 声明 变量 的 类 型 。 根 据 赋值 语句 
来 自动 推断 变量 类 型 ,根据 函数 调用 时 传递 的 实 参 来 自动 推断 形 参 类 型 ,这 不 仅 体现 了 变 
量 的 动态 性 ,更 重要 的 是 提高 函数 的 适用 范围 ,有 利于 代码 复 用 。 但 在 实际 开发 中 ,有 
时 候 可 能 需要 限制 函数 所 能 接收 的 实 参 类 型 ,虽然 Python 允许 使 用 一 种 标注 函数 参数 和 
返回 值 类 型 的 形式 ,但 实际 上 并 不 起 作用 。 如 果 确 实 需要 对 函数 参数 和 返回 值 类 型 进行 
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严格 的 限制 ,可 以 考虑 使 用 断言 语句 assert 异常 处 理 结构 或 f…else 语句 再 结合 type( ) 、 
isinstance( ) 之 类 的 类 型 检查 函数 来 确保 参数 类 型 。 
下 面 的 函数 要 求 参 数 必须 为 整数 ,如 果 接 收 到 任何 其 他 类 型 的 参数 都 会 抛 出 异常 。 
如 果 把 其 中 的 几 个 assert 语句 删除 或 者 注释 掉 的 话 就 会 发 现 ,所 谓 标注 函数 参数 和 返回 
值 类 型 的 形式 并 不 起 什么 作用 ,只 是 看 上 去 比较 清晰 而 已 ,真正 起 作用 的 是 其 中 的 assert 
语句 。 
>>>Gef test (x:int,y:int) ->int: 
"x and y mst be integers, retm an integer x+y"'"" 
assert jsinstance (xy int), 'x mst be integer' 
assert jsinstance (y, int), 'y mst be integer' 
z=x+y 
assert jsinstance (z, int), must rebim an integer' 
rebmz 
>>>test (1,2) 
3 
>>>test (2,3.0) 惨 数 类 型 不 符合 要 求 , 抛 出 异常 
RsserticnError: y rmust be integer 


5.3 变量 作用 域 


531 全 局 变量 与 局 部 变量 


变量 起 作用 的 代码 范围 称 为 变量 的 作用 域 ,不 同 作用 域内 同名 变量 之 间 互 不 影响 ,就 
像 不 同文 件 夹 中 的 同名 文件 之 间 互 不 影响 一 样 。 在 函数 外 部 和 在 函数 内 部 定义 的 变量 ， 
其 作用 域 是 不 同 的 ,函数 内 部 定义 的 变量 一 般 为 局 部 变量 ,在 函数 外 部 定义 的 变量 为 全 局 
变量 。 不 管 是 局 部 变量 还 是 全 局 变量 ,其 作用 域 都 是 从 定义 的 位 置 开 始 的 ,在 此 之 前 无 法 
访问 。 

在 函数 内 定义 的 局 部 变量 只 在 该 函数 内 可 见 , 当 函数 运行 结束 后 ,在 其 内 部 定义 的 所 
有 局 部 变量 将 被 自动 删除 而 不 可 访问 。 在 函数 内 部 使 用 global 定义 的 全 局 变量 当 隐 数 结 
束 以 后 仍然 存在 并 且 可 以 访问 。 

如 果 想 要 在 函数 内 部 修改 一 个 定义 在 函数 外 的 变量 值 ,必须 要 使 用 global 明确 声明 ， 
否则 会 自动 创建 新 的 局 部 变量 。 在 函数 内 部 通过 global 关键 字 来 声明 或 定义 全 局 变量 ， 
这 分 两 种 情况 。 

(1) 一 个 变量 已 在 函数 外 定义 ,如 果 在 函数 内 需要 修改 这 个 变量 的 值 ,并 将 修改 的 结 
果 反 映 到 函数 之 外 ,可 以 在 函数 内 用 关键 字 global 明确 声明 要 使 用 已 定义 的 同名 全 局 
变量 。 

(2) 在 函数 内 部 直接 使 用 global 关键 字 将 一 个 变量 声明 为 全 局 变量 ,如 果 在 函数 外 
没有 定义 该 全 局 变量 ,在 调用 这 个 隐 数 之 后 ,会 创建 新 的 全 局 变量 。 





128 Python 程序 设计 开发 宝典 
Ph 
或 者 说 ,也 可 以 这 么 理解 : 四 在 函数 内 如 果 只 引用 某 个 变量 的 值 而 没有 为 其 赋 新 值 ， 
该 变量 为 ( 隐 式 的 ) 全 局 变量 ; @ 如 果 在 函数 内 某 条 代码 有 为 变量 赋值 的 操作 ,该 变量 就 
被 认为 是 ( 隐 式 的 ) 局 部 变量 ,除非 在 函数 内 赋值 操作 之 前 显 式 地 用 关键 字 global 进行 了 


声明 。 

下 面 的 代码 演示 了 局 部 变量 和 全 局 变量 的 用 法 。 

>>>Gef deam(): 
oal x 后 明 或 创建 全 局 变量 ,必须 在 使 用 x 之 前 执行 
xn 硼 改 全 局 变量 的 值 
y34 握 部 变量 
Print (x,y) 

>>x 交 本 寿 函 数 外 部 定义 了 全 局 变量 x 

>>>deno() 硒 次 调用 修改 了 全 局 变量 x 的 值 

34 

>>>x 

3 

>>>y 桐 部 变量 在 函数 运行 结束 之 后 自动 删除 ,不 再 存在 

NEmeError: name 'y' is not defined 

>>>Gel x 删除 了 全 局 变量 x 


>>>x 

NEmeError: name 'x' js not defined 

>>>denp() 体 次 调用 创建 了 全 局 变量 

34 

>>>x 

3 

如 果 在 某 个 作用 域内 有 为 变量 赋值 的 操作 ,那么 该 变量 将 被 认为 是 该 作用 域内 的 局 
部 变量 ,这 一 点 一 定 要 引起 注意 。 


>>>x10 丛 局 变量 

>>>Gef cemp (0): 
Print (x) 谤 条 语句 会 引发 异常 ,因为 x 变量 现在 还 不 存在 
XX 姥 值 语句 ,xz 将 被 认为 是 该 作用 域内 的 局 部 变量 
print Go 

>>>Gerp (0) 


UhbcuncirocalFrror: local variable 'x' referenced before assignment 
如 果 局 部 变量 与 全 局 变量 具有 相同 的 名 字 ,那么 该 局 部 变量 会 在 自己 的 作用 域内 暂 
时 隐藏 同名 的 全 局 变量 。 


>>>cef dam0: 
x 简 建 了 局 部 变量 ,并 自动 隐藏 了 同名 的 全 局 变量 


print (0) 


第 5 章 代码 复 用 技术 (一 ) : 函数 = 129 
K 





>>>x5 着 | 建 全 局 变量 


医 数 调用 结束 后 ,不 影响 全 局 变量 x 的 值 


如 果 需 要 在 不 同 模块 之 间 共 享 全 局 变量 的 话 ,可 以 编写 一 个 专门 的 模块 来 实现 这 一 
目的 。 例 如 ,假设 在 模块 A. py 中 有 如 下 变量 定义 : 

glcbal_ variaple <0 

而 在 模块 B. py 中 使 用 以 下 语句 修改 该 全 局 变量 的 值 : 

inport A 

R.glcbal_variable 司 

在 模块 C. py 中 使 用 以 下 语句 来 访问 全 局 变量 的 值 : 

irport A 

Print R.glcbal_ variable) 

一 般 而 言 , 局 部 变量 的 引用 速度 比 全 局 变量 要 快 一 些 , 应 优先 考虑 使 用 。 并 且 应 该 尽 
量 避 免 过 多 使 用 全 局 变量 ,因为 全 局 变量 会 增加 不 同 函数 之 间 的 隐 式 看 合 度 ,降低 代码 可 
读 性 ,并 使 得 代码 测试 和 纠 错 变 得 很 困难 。 

局 部 变量 的 空间 是 在 栈 上 分 配 的 ,而 栈 空间 是 由 操作 系统 维护 的 ,每 当 调 用 一 个 隐 数 
时 ,操作 系统 会 为 其 分 配 一 个 栈 帧 ,函数 调用 结束 后 立刻 释放 这 个 栈 帧 。 因 此 , 消 数 调用 
结束 后 ,该 函数 内 部 所 有 的 局 部 变量 都 不 再 存在 。 

内 置 函数 globals( ) 和 locals( ) 分 别 返 回 包含 当前 作用 域内 所 有 全 局 变量 和 局 部 变量 
的 名 称 和 值 的 字典 。 


>>>a=(1,2,3,4,5) 恰 局 变量 
>>>pb='Helo world." 丛 局 变量 
>>>cGef dam(0 : 
a=8 桐 部 变量 
b=[1,2,3] 握 部 变量 


Print ("locals:', locals()) 
Print (cglabals:"vglcbals ()) 


>>>cGemp () 

locals: {'a': 3, b': [1,2,3]} 

lonals: {'a': (1,2,3,4,5),b': "HEIo warld. builtins _': qodile' builtin _' Quilt -in) 
> "demp': <finctin dampat 0x013907F0>,' package _':Nne,’ rare _':' min dc 


': Nne} 
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532 nonlocal 变量 


除了 局 部 变量 和 全 局 变量 ,Python 还 支持 使 用 nonlocal 关键 字 定 义 一 种 介 于 两 者 之 
间 的 变量 。 关 键 字 nonlocal 声明 的 变量 会 引用 距离 最 近 的 非 全 局 作用 域 的 变量 ,要 求 声 
明 的 变量 已 经 存在 ,关键 字 nonlocal 不 会 创建 新 变量 。 


aef socpe test(): 
aef op local 0 : 
sem 一 我 是 局 部 变量 " 


GEf dp ncnlccal () : 
nonlocal spem 和 巩 时 要 求 em 必须 是 已 存在 的 变量 
sem 一 我 不 是 局 部 变量 ,也 不 是 全 局 变量 " 


aef cb glcbal 0) : 
glcbal spam 霹 果 全 局 作用 域内 没有 spam, 就 自动 新 建 一 个 
stem=" 我 是 全 局 变量 " 


sEem 一 原来 的 值 " 

cb _ local 0 

Erint ("局 部 变量 赋值 后 : "spam 
Gb nanlocal() 

Frint ("nonlocal 变量 赋值 后 : "seam 
cb glchal 0 

Frint ("全 局 变量 赋值 后 : ", spam) 


sope test() 
primt ("全 局 变量 : ", spam) 
上 面 的 代码 运行 结果 为 


局 部 变量 赋值 后 : 原来 的 值 

noniocal 变量 赋值 后 : 我 不 是 局 部 变量 ,也 不 是 全 局 变量 
全 局 变量 赋值 后 : 我 不 是 局 部 变量 ,也 不 是 全 局 变量 

全 局 变量 : 我 是 全 局 变量 


5.4 lambda 表达 式 


lambda 表达 式 常 用 来 声明 匿名 杖 数 , 即 没有 本 数 名 字 的 临时 使 用 的 小 函数 ,常用 在 
临时 需要 一 个 类 似 于 函数 的 功能 但 又 不 想 定义 函数 的 场合 ,例如 ,内 置 函数 sorted( ) 和 列 
表 方 法 sort( ) 的 key 参数 ,内 置 函 数 map( ) 和 filter( ) 的 第 一 个 参数 ,等 等 。lambda 表达 
式 只 可 以 包含 一 个 表达 式 , 不 允许 包含 其 他 复杂 的 语句 ,但 在 表达 式 中 可 以 调用 其 他 函 
数 ,该 表达 式 的 计算 结果 相当 于 函数 的 返回 值 。 下 面 的 代码 演示 了 不 同情 况 下 lambda 表 
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达 式 的 应 用 。 


>>>f Aanbda xyrz: xyz 他 可 以 给 lanbca 表达 式 起 个 名 字 
>>>print (£0,2,3)) 把 lanbda 表达 式 当 作 函 数 使 用 
6 
>>>g 4anbda xsy HQ,zZB: xYyz 彼 持 默认 值 参数 
>>>prirt(G)) 
6 
>>>print gC,z A,y 5)) 椅 用 时 使 用 关键 参数 
往 
>>>L=[ (lanbda x: 民 # 夫 ) ，(]anipaa x: x**3), (lanbda x: x**4)] 
>>>print (L[0] @) ,L101] C2),L[2] C)) 
4816 
>>>D={"f1": (lanbda: 2 +13), "2': (lanbda: 2* 3), "5B"': (lanbda: 2*:8)} 
>>>print DL'AL'] 0,D['22'] 0 ,DI'B'] 0) 
568 
>>>L=[1,2,3,4,5] 
>>>1ist ep (lambda x: x 10,0)) arbda 表达 式 作 为 函数 参数 
[11,12,13,14,15] 
>>>Gef demp (nN) : 
IEtbmm ny 了 
>>>Gemp (5) 
25 
>>>a_ list=[1,2,3,4,5] 
>>>1ist trep (lanbda x: deno (x) ,a_1ist)) 将 lanibda 表达 式 中 可 以 调用 函数 
[1,4,9,16,25] 
>>>qata =1ist (range (20)) 
>>>import rancom 
>>>rancom.shufPle (data) 
>>>Gata 
[4,3,11,13,12,15,9,2,10,6,19,18,14,8,0,7,5,17,1,16] 
>>>data. sort (key Lanbda x: x) 明 在 列表 的 sort 0 方法 中 ,作为 函数 参数 
>>>Gata 
[0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19] 
>>>cata. sort (ey arbda x: len(str (0))) 车 用 larbda 表达 式 指 定 排序 规则 
>>>cata 
[0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19] 
>>>Gata. sort (key =lanbda x: len (str (x)), reverse =True) 
>>>data 
[10,11,12,13,14,15,16,17,18,19,0,1,2,3,4,5,6,7,8,9] 


在 使 用 lambda 表达 式 时 ,要 注意 变量 作用 域 可 能 会 带 来 的 问题 ,例如 ,下 面 的 代码 中 


变量 x 是 在 外 部 作用 域 中 定义 的 ,对 lambda 表达 式 而 言 不 是 局 部 变量 ,从 而 导致 出 现 了 
错误 。 
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>>>r=[] 
>>>for x in range (10): 
Ir.append (lanbda: x**P) 
>>>r[1] 0 精 自 行 验 证 r[0] 0 .=2] 0 .=G] 0 和 其 他 几 个 
81 
>>>x 3 
>>>r[1]0 
9 


而 修改 为 下 面 的 代码 , 则 可 以 得 到 正确 的 结果 。 


>>>r=[] 

>>>for x in range (10): 

r.apend (lanbda n =x: Nn*@®) 

>>>r[0] () 

0 

>>>r[1]() 

各 

>>>r[5] () 婧 自行 验证 其 他 几 个 

25 

或 许 下 面 这 个 例子 更 能 说 明 问 题 ,这 里 的 lambda 表达 式 相 当 于 只 有 一 条 return i 语 
句 的 小 函数 ,调用 时 真正 的 返回 值 取决 于 全 局 变量 i 的 当前 值 。 

>>>f =lanbda :i 

>>>i33 

>>>f£() 

3 

>> 习 本 

>>>f£() 

5 

作为 一 种 花哨 的 技巧 ,可 以 定义 向 套 的 lambda 表达 式 , 再 结合 内 置 函 数 map( ) ,filter 
(以 及 其 他 函数 ,可 以 实现 一 些 复 杂 的 计算 ,尽管 并 不 建议 这 样 用 。 例 如 ,下 面 的 代码 输 
出 100 之 内 的 所 有 素数 ,为 了 看 得 更 清楚 ,作者 拆 成 了 几 行 并 使 用 缩 进 表 示 了 各 部 分 的 关 
系 ,尽管 这 样 ,相信 大 家 还 是 觉得 很 难 理解 。 

Print (list (filter Qne, 

mep (lanbda y:y* Tecubce (lanbda x,y:x* y! 0, 
mep (lanbda x,y ~y:y%x, 
range C,int (y*0.5 +1))), 
1) ,range (2,1000))))) 

下 面 的 代码 输出 斐 波 那 契 数 列 的 前 10 个 数字 ,相当 于 函数 的 递归 调用 ,和 上 一 段 代 

码 一 样 , 并 不 是 很 容易 理解 。 


Print (list (rep (lanbbda x,f =lanbda x,f: (f(x -1,f) +4f(x-2,D) if x3 else 1:f (x,f),range (10)))) 





最 后 应 注意 ,虽然 使 用 lambda 表达 式 可 以 很 方便 灵活 地 定义 一 些小 函数 ,但 是 ,如 果 
仅仅 是 需要 一 个 简单 的 运算 ,那么 应 该 尽量 使 用 标准 库 operator 中 提供 的 本 数 ,避免 自己 
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定义 lambda 表达 式 ,operator 中 的 函数 执行 效率 更 高 一 些 。 


5.5 生成 器 函数 设计 要 点 


包含 yield 语句 的 函数 可 以 用 来 创建 生成 器 对 象 ,这 样 的 函数 也 称 生成 器 函数 。yield 
语句 与 return 语句 的 作用 相似 ,都 是 用 来 从 函数 中 返回 值 。return 语句 一 旦 执行 会 立刻 结 
束 函 数 的 运行 ,而 每 次 执行 到 yield 语句 并 返回 一 个 值 之 后 会 暂停 或 挂 起 后 面 代码 的 执行 ， 
下 次 通过 生成 器 对 象 的 _ _next_ _() 方 法 .内置 函数 next( ) \for 循环 遍历 生成 器 对 象 元 素 或 
其 他 方式 显 式 “索要 "数据 时 恢复 执行 。 生 成 器 具有 情 性 求 值 的 特点 ,适合 大 数据 处 理 。 下 


面 的 代码 演示 了 了 如何 使 用 生成 器 来 生成 斐 波 那 契 数 列 : 


>>>Gef £(): 
ab3l 
while True: 
Yielda 
abzDatp 
>>>a=£f() 
>>>for i in range (10): 
printa. _next _(,end=' ') 
11235813234455 
>>>for i in £(): 
i£f i 3100: 
Print (i,end=" ') 
break 


疗 列 解 包 , 同 时 为 多 个 元 素 赋值 
御 停 执行 ,需要 时 再 产生 一 个 新 元 素 
和 疗 列 解 包 ,继续 生成 新 元 素 


李建生 成 器 对 象 
赃 波 那 契 数列 中 前 10 个 元 素 


朵 波 那 契 数 列 中 第 一 个 大 于 100 的 元 素 


他 | 建生 成 器 对 象 
辣 用 内 管 函 数 next 0 获取 生成 器 对 象 中 的 元 素 


等 次 索取 新 元 素 时 ,由 yield 语 句 生 成 


她 可 以 调用 生成 器 对 象 的 __next __0 方 法 


竺 用 Yiela 表 达 式 创建 生成 器 


133 
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>>>for item in x: 其 出 x 中 的 剩余 元 素 
print (itemend=" ') 


cdefg 

>>>def gen0 : 
yield1 
Yiela2 
Yiela3 


>>>x,y,z2 =gen() 性 成 器 对 象 支持 序列 解 包 


生成 器 对 象 还 支持 使 用 send( ) 方 法 传人 新 值 ,从 而 改变 后 续 生 成 的 数据 ,这 时 要 对 
yield 表达 式 稍微 改写 一 下 。 


>>>aef gen (start,end) : 
i=start 
while i <end: 
v=(yield i) 
ifvV: 
Ew 
else: 
二 


>>>g =gen (1,101) 

>>>next (g) 

了 

>>>g._  _next _() 

2 

>>>g.send(9) 装 入 新 值 ,改变 后 续 生 成 的 数据 
党 

>>>next (g) 

10 


Python 标准 库 itertools 提供 了 一 个 count( start，step) 函数 ,用 来 连续 不 断 地 生成 无 穷 
个 数 ,这 些 数 中 的 第 一 个 数 是 start( 默认 为 0) , 相 邻 两 个 数 的 差 是 step( 默认 为 1)。 下 面 
的 代码 使 用 生成 器 模拟 了 标准 库 itertools 中 的 count( ) 函数 。 


>>>Gef count (start, step) : 


nm=start 
while True: 议 穷 循环 
Yield nm 上 彼 回 一 个 数 ,暂停 执行 ,等 待 下 一 次 索要 数据 
nm +=step 
>>>x=cont GB,5) 


>>>for i in range (10) : 
Print (next (x) ,end=" ') 

381318 23 28 了 3 3 43 48 

>>>for i in zanged0): 
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Erint (ext (2) ,end =" ') 
53 58 63 68 73 78 83 88 93 98 


Python 标准 库 inspect 中 的 isgeneratorfunction( ) 函数 可 以 用 来 判断 一 个 函数 是 否 为 生 
成 器 函数 。 


>>>Gef test (a,b): 
retmatp 
>>>import inspect 
>>>inspect .isgeneratiorfinction (test) 
False 
>>>Gef test(): 
Yield fran (1,2,3) 
for i in range (4,6): 
yieldi 
>>>inspect .isgeneratorfinctian (test) 
True 
>>>t test () 
>>>for item in 七 : 
Erint (itemwend=" ') 
12345 


融通 函数 


考 成 器 函数 


妨 历 生成 器 对 象 中 的 元 素 


5.6 偏 函 数 与 函数 柯 里 化 


偏 函 数 ( partial function) 和 函数 柯 里 化 (function currying) 是 函数 式 编程 中 常用 的 技 
术 。 有 时 候 人 们 在 复 用 已 有 函数 时 可 能 需要 固定 其 中 的 部 分 参数 ,这 除了 可 以 通过 默认 
值 参 数 来 实现 之 外 ,还 可 以 使 用 偏 函数 。 

例如 ,下 面 的 代码 创建 了 内 置 函数 print( ) 的 偏 隐 数 并 进行 调用 。 


>>>fram finctools inport partial 

>>>finc =partial (print, 'Hello world. ', fush =True) 
>>>fonc() 

Hello world. 

再 例如 ,有 个 函数 用 来 实现 3 个 数字 相 加 : 


Cef adtB (abyc) : 
rebmatpic 
如 果 现 在 需要 一 个 类 似 的 函数 ,与 上 面 的 函数 add3( ) 的 区 别 仅 在 于 参数 b 固定 为 一 
个 数字 (例如 666) ,这 时 就 可 以 使 用 偏 函数 的 技术 来 复 用 上 面 的 函数 。 


GEf actp (avc) : 
Tetom aco3 (a,666,c) 

Print (ace2 QI)) 

或 者 使 用 标准 库 functools 提供 的 partial( ) 方 法 创建 指定 函数 的 偏 函 数 。 
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fran finctiools import partial 

aocP =partial (adtB,b =666) 

Erirt (aiP (a3,c3)) 

再 例如 ,下 面 的 代码 创建 了 int( ) 的 偏 函数 ,并 固定 其 参数 base 为 2。 

fram fanctools inport Partial 

int2 =partial (int,base 2) 

Print (int2 ("111°')) 

函数 柯 里 化 除了 可 以 实现 偏 函 数 类 似 的 功能 之 外 ,还 可 以 利用 单 参数 函数 来 实现 多 
参数 函数 ,这 要 归功 于 Python 对 函数 嵌 套 定义 和 lambda 表达 式 的 支持 。5.1.2 节 介 绍 的 
让 套 函数 其 实 就 说 明了 函数 柯 里 化 的 用 法 ,这 里 再 举 一 个 例子 。 

Gef finc (a): 

IEtbum lanbda p: a 
print (fmcG) (5)) 


Print (finc (3) (5)) 
当然 ,也 可 以 多 级 嵌 套 定义 函数 实现 更 多 参数 的 需求 。 


Print (finc 8) G) 8)) 
5.7 单 分 发 器 与 泛 型 函数 


这 里 的 泛 型 函数 (generic function) 是 指 由 一 组 为 不 同类 型 参数 执行 相似 操作 的 函数 
组 成 的 函数 ,具体 调用 哪 一 个 函数 的 实现 取决 于 分 发 算法 和 参数 类 型 。Python 单 分 发 器 
是 实现 泛 型 函数 的 一 种 形式 ,由 一 个 单一 参数 来 决定 选择 和 调用 哪个 隐 数 。 下 面 的 代码 
演示 了 单 分 发 器 泛 型 函数 的 有 关 用 法 : 


@ singledispath 
def fin (argvverbose -False) : 
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避 " 如 果 没 有 合适 的 函数 ,就 调用 这 个 函数 '"" 
if verbose: 

Erint (Tet me just say, ',end=" ') 
Frint (arg) 


把 register 当 作 修 饰 器 使 用 ,为 不 同类 型 的 参数 分 别 创建 不 同 的 实现 
车 用 下 面 线 表示 不 关心 函数 的 具体 名 字 
@ fin.register (int) 
Cef (arg,verbose =False): 

""' 如 果 第 一 个 参数 的 类 型 是 int, 就 调用 这 个 函数 ''" 

if verbose: 

Print ('strength in nmbers, ',end=" ') 
Frint (arg) 


她 可 以 为 函数 起 个 名 字 
@ fin.register (foat) 
ef fin nm(arg, verbose =False): 
号 "如 果 第 一 个 参数 的 类 型 是 日 cat, 就 调用 这 个 函数 
if verbose: 
Print ('Half of your nuiber is:',end=" ') 
Print (arg/2) 


@ fin.register (list) 
@ fin.register (bple) 
GEf _ (arg,verbose =False): 
""' 如 果 第 一 个 参数 的 类 型 是 list 或 bple, 就 调用 这 个 函数 ''' 
if verbose: 
Print ("Enmerate this:') 
fr i,v in ermerate (arg) : 
Print (i,v) 


相 定 义 类 
Class Scores: 
def__init _ (salf, score) : 
Self.soore ist (soore) 
萝 自 定义 类 型 创建 泛 型 函数 
@ fin.register (Soores) 
Gef _ (arg,verbose =False): 
if verbose: 
Print (The soores are:') 
for sc in arg.score: 
Print (scvena=' ') 


内 果 第 一 个 参数 是 NEne 的 类 型 ,就 调用 这 个 函数 
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def dNothing (arg, verbose -False) : 

print (Nbthing to ob.') 
何以 把 register0 当 作 函 数 使 用 来 注册 指定 类 型 
fin.register (type Nene) ,GoNpthing) 


梨 用 原始 函数 

fin('Hello world.') 

英 用 针对 整 型 参数 的 函数 
fim(666, True) 

租用 针对 实 型 参数 的 函数 
fan(6.66) 
椅 用 针对 列表 和 元 组 参数 的 函数 

fin(list (range (5,10))) 

fin (tuple (range (10,15))) 

椅 用 针对 Nene 类 型 参数 的 函数 ceNothing() 
En Ncne) 
租用 原始 函数 

fin({1,2,3}, True) 

椅 用 针对 自 定义 类 型 scores 参数 的 函数 
fin (scores (1,2,3,4,5)) 





5.8 协 程 函数 


Python 3.5 之 后 的 版 本 还 引入 了 一 种 新 的 协 程 函数 ,使 用 async def 进行 定义 或 者 使 
用 @ asyncio. coroutine 作为 修饰 器 ,如 果 不 需要 支持 旧版 本 的 Python ,推荐 优先 使 用 async 
def 定义 协 程 函 数 。Python 3. 6. x 开始 进一步 改进 了 设计 ,支持 在 协 程 函数 中 同时 使 用 
await 和 yield ,这 样 就 可 以 定义 异步 生成 器 对 象 了 。 这 里 先 介绍 一 下 协 程 函数 的 定义 语法 
和 基本 用 法 ,更 多 关于 协 程 的 内 容 请 参考 12.3 节 。 

下 面 的 代码 使 用 asyn def 定义 了 一 个 协 程 函 数 , 并 调用 该 函数 输出 Hello world 。 


inport asyncio 


async def hello world(): 
Print (“Helo world!™") 


妨 动 事件 循环 

locp esyncio.get event loop0 

帘 | 建 任务 ,调用 函数 并 等 待 函 数 执行 结束 
locp.run_until aaplete hello world()) 
locp.close0 


下 面 的 代码 使 用 @ asyncio. coroutine 修饰 器 定义 了 一 个 协 程 函数 ,并 调用 该 函数 连续 
输出 60 次 当前 时 间 。 
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jimport asyncio 
jimport aatetime 


@ asyncio.coroutine 
cef display aate (1op): 
erd time ocp.time () +60 
while True: 
Print (datetime.datetime.now ()) 
if (lop.time() 11.0) >=end time: 
break 
娃 意 ,是 yielqd from 不 是 yield 
Yield fram asyncio.slesp (1) 


lop easyncio.get event loop() 

髓 用 函数 并 等 待 函 数 执行 结束 
lop-.rmn ntil omplete(display date (loop)) 
locp.close() 


其 中 的 协 程 函 数 display_date( loop) 也 可 以 使 用 下 面 的 方式 定义 : 


async def display date (lop): 
end time oop.time() +60 
while True: 
Print (datetime .datetime.now ()) 
if doqp.time0 1.0) >=end time: 
break 
await asyncio.slesp (1) 


下 面 的 代码 定义 了 两 个 协 程 函数 ,并 在 一 个 协 程 函 数 中 调用 另 一 个 协 程 也 数 , 实 现 了 
两 者 之 间 的 同步 。 
irport asyncio 


async Gef compute (x,y) : 
Print ("Corputing $s +4%5..."% (x,y)) 
await asyncio.slesp (3.0) 
rebm x+y 


async def print sm(x,y): 
Tesult =evait corpute (x,y) 
Frint ("Sucoess! ng s 4s=Ss" S$ (X,Yy,result)) 


locp asyncio.get event loop0 
lop-nn until onplete (print sm(,2)) 
loop-close0 
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下 面 的 代码 使 用 协 程 函 数 定义 了 一 个 异步 生成 器 。 
jimport asyncio 
async Gef ticker (Gelay, to) : 
for i in range (to) : 
Yieldi 
ait asyncio.sleep (Gelay) 


async Gef rn(): 
async for i in ticker (1,10) : 
Print (i) 
lop =esyncio.geE event loop() 
try: 
lop.rmn until complete(run0) 
finally: 
locp.clcse() 


5.9 注册 程序 退出 时 必须 执行 的 函数 


标准 库 atexit 支持 注册 程序 退出 时 执行 的 函数 ,下 面 的 程序 运行 结束 时 会 自动 调用 
test( ) 函数 。 


irport atexit 


5.10 回调 函数 原理 与 实现 


回调 函数 的 定义 与 普通 函数 并 没有 本 质 的 区 别 , 区 别 在 于 回调 函数 不 是 用 来 直接 调 
用 的 ,而 是 作为 参数 传递 给 另 一 个 函数 , 当 另 一 个 函数 中 触发 了 某 个 事件 、 满 足 了 某 个 条 
件 时 就 会 自动 调用 回调 函数 。 下 面 的 代码 演示 了 回调 函数 的 定义 与 使 用 ,在 删除 文件 时 


第 5 章 代码 复 用 技术 (一 ) : 函数 6 141 





如 果 出 现 异常 则 自动 调用 回调 函数 ,在 回调 函数 中 修改 文件 属性 然后 再 次 进行 删除 。 


inport os 

jimport stat 

GEf zerove reacinly (fnc,path) : 年 义 回 调 函 数 
05.drod (path, stat.s_IWRITE) 删除 文件 的 只 读 属 性 
fimc (path) 本 次 调用 刚刚 失败 的 函数 


GEf del dir (path, merror one) : 
for file in cs.listdir path) : 
file or dir =05.path.join (path, file) 
if os.path.isdir (file or dir) ard rot os.path.islink (file or dir): 


cel dir(file or dir) 婵 归 删 除 子 文件 夹 及 其 文件 
else: 
try: 
cs.rerove (file or dir) 峰 试 删除 该 文件 
Exept: 删除 失败 


证 cnerror ard callable (anerror) : 
cnerror (cs.remove file or dir) 相 动 调用 回调 函数 


else: 
Print ('You have an excepticn but did not ceapbure it.') 
cs.mmcir (path) 删除 文件 夹 
cel dir('E: \\pld", rarove_ readinly) 柚 用 函数 ,指定 回调 函数 


5.11 精彩 案例 赏析 


示例 5-1 编写 函数 ,接收 任意 多 个 实数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 所 有 参 


数 的 平均 值 ,其 他 元 素 为 所 有 参数 中 大 于 平均 值 的 实数 。 


GEf damp (Fara) : 
a =sum (para) /len (para) 多 均值 
g=[i for i in para if i>avg] 出 表 推 导 式 


reim (awg,) tbple(g) 


示例 5-2 ”编写 函数 ,接收 字符 串 参 数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 大 写字 母 


个 数 ,第 二 个 元 素 为 小 写字 母 个 数 。 


GEf cemp(s) : 
result =[0,0] 
for ch in s: 
if dh.islower(): 
result[1] + 本 
elif ch.isopper( : 
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result[0] + 本 
rebm tuple (result) 
示例 5-3 编写 函数 ,接收 包含 n 个 整数 的 列表 lst 和 一 个 整数 k(0<k <n) 作 为 参 
数 ,返回 新 列表 。 处 理 规则 为 : 将 列表 lst 中 下 标 k 之 前 的 元 素 逆序 ,下 标 k 之 后 的 元 素 
逆序 ,然后 将 整个 列表 lst 中 的 所 有 元 素 逆序 。 
Gef deampdstI: 
xst[k 1:: 1] 
yst[:k11: 1] 
retum list (reversed (x +y)) 
本 例 描述 的 实际 上 是 将 列表 循环 左 移 k 位 的 算法 实现 ,下 面 的 代码 使 用 了 更 加 直接 
的 方法 ,但 对 于 长 列表 来 说 效率 远 不 如 上 面 的 代码 高 ,因为 pop(0) 操 作 在 列表 首部 删除 
元 素 ,这 会 引起 大 量 元 素 的 前 移 。 
ef deam(lst,lo : 
te 本 st[:] 
for i in range (1) : 
tarp.append (tenp.pop (0)) 
retum temp 
搞 清楚 问题 的 本 质 以 后 ,对 于 本 例 中 描述 的 问题 ,使 用 切片 可 以 直接 实现 ,可 以 达到 
最 快 的 速度 。 
GEf dno (1st,1) : 
TIetum 1st[k:] +lst[:k] 
Python 标准 库 collections 提供 的 双 端 队列 可 以 直接 实现 循环 左 移 位 和 右 移 位 ,更 加 
灵活 方便 。 





>>>fram collecticns jmport deqe 


>>>q=aeqne (range C0)) 覃 | 建 双 端 队列 
>>>q.rotate (3) 循环 右 移 位 
>>>G 

aeqhe(017,18,19,0,1,2,3v4,5,6r7,8v9v10,11,12,13,14,15,16]) 
>>>q.rotate( -3) 往 环 左 移 位 
>>>q 


eqe ([0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19]) 
示例 5-4 编写 函数 ,接收 一 个 整数 t 作 为 参数 ,打印 杨 辉 三 角 前 t 行 。 


Sef Yenghui (t) : 
print (0]) 
line=[1,1] 

Print Qine) 
for i in range C,t): 
r=[] 
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for j in range ,1en (line) 1): 
r.apperd Qine[j] Hine[lj 41) 
line=[1] +0] 
print (line) 
示例 5-5 ”编写 函数 ,使 用 collections 标准 库 的 defaultdict 实现 上 例 的 功能 。 
杨辉 三 角 也 可 以 使 用 Python 标准 库 collections 提供 的 defaultdict 类 来 实现 ,也 就 是 带 
默认 值 的 字典 。 如 果 需 要 访问 defaultdict 类 的 对 象 中 某 个 特定 的 值 但 不 存在 时 ,不 会 抛 
出 异常 ,而 是 会 给 出 一 个 默认 值 。 


Gef Yenghui on) : 
赴 1 有 元 素 默 认 值 为 0 
triangle -defaultdict (int) 
for row in range (nN): 
每 行 第 一 个 元 素 为 1 
triangle[row,0] 习 
Print (triangle [row,0],end=" \t') 
性 成 该 行 后 续 元 素 
for col in range (1,row +11): 
上 茹 果 指 定位 置 的 元 素 不 存在 ,默认 为 0 
triangle[row, 1] triangle[row 1,001 1] +triangle[row 71,001] 
Print (triangle [row, ool],end=" \t") 
Print () 


YEnghui d4) 


示例 5-6 ”编写 函数 ,接收 一 个 正 偶数 作为 参数 ,输出 两 个 素数 ,并 且 这 两 个 素数 之 
和 等 于 原来 的 正 偶数 。 如 果 存 在 多 组 符合 条 件 的 素数 , 则 全 部 输出 。 


Gef dem (Nn): 
aef IsPrime (p) : 

if p=32: 
retim True 

if ps2==0: 
retum False 

for i in range GB, int (p*;0.5) ,2): 
if psi==0: 

Ietim False 
retim True 


证 isinstance (n, int) andn >0 and ns2=-=0: 
for i in range Cn//2 1): 
if IsPrime (i) and IsPrime ni): 
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Print (i,' tn-i,' =",n) 
示例 5-7 编写 函数 ,接收 两 个 正 整 数 作 为 参数 ,返回 一 个 元 组 ,其 中 第 一 个 元 素 为 
最 大 公约 数 ,第 二 个 元 素 为 最 小 公 倍 数 。 


cef dam mm): 
pam*n 
while mn! -0: 
mnnmn 
retm nm,p//n) 


另外 ,Python 标准 库 fractions 中 提供 了 gcd( ) 函数 用 来 计算 最 大 公约 数 , 在 Python 3. 
5 和 更 新 版 本 中 ,标准 库 math 也 提供 了 计算 最 大 公约 数 的 函数 ged( ) 。 利 用 gcd( ) 函数 ， 
上 面 的 代码 也 可 以 写作 : 


Gef dp tn) : 
jimport math 
raath.godtmn) 
retim (r, tn* n)//r) 


示例 5-8 ”编写 函数 ,接收 一 个 所 有 元 素 值 都 不 相等 的 整数 列表 x 和 一 个 整数 n, 要 
求 将 值 为 n 的 元 素 作为 支点 ,将 列表 中 所 有 值 小 于 n 的 元 素 全 部 放 到 1n 的 前 面 , 所 有 值 大 
于 nm 的 元 素 放 到 n 的 后 面 。 


def demp (x,n) : 
t=[i foriinxifi<an] 
t=[i fori inx if i>n] 
rebmtl +[n] +t2 
上 面 的 代码 已 经 很 棒 了 ,只 是 还 有 一 点 小 瑕 症 。 这 段 代 码 使 用 了 两 个 列表 推导 式 ,对 
列表 x 中 的 元 素 扫描 了 两 遍 。 下 面 的 代码 昌 然 看 起 来 长 了 一 点 ,但 是 只 需要 对 列表 中 的 
元 素 扫描 一 遍 就 能 得 到 结果 ,对 于 长 列表 而 言 执行 效率 还 是 有 很 大 提升 的 。 
GEf demp (x,n) : 
地 = 
t={l 
for i inx: 
ifian: 
tappend i) 
elif i >n: 
t2.append i) 
rebm tl +[n] +t2 
示例 5-9 ”编写 函数 ,计算 字符 串 匹 配 的 准确 率 。 
以 打字 练习 程序 为 例 , 假 设 origin 为 原始 内 容 ,userInput 为 用 户 输入 的 内 容 , 下 面 的 
代码 用 来 测试 用 户 输入 的 准确 率 。 
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Gef Fate (originvuserrmput) : 
证 ot (isinstance (origin, str) and isinstance (userrput, str)): 
Erint ("Ihe two parameters must be strings.") 
rebm 
right =sm( ( for oru in zip(origin,userIrput) if o==)) 
IEbum round (right /len (origin) ,2) 


示例 5-10 编写 函数 ,使 用 非 递 归 方 法 对 整数 进行 因数 分 解 。 
fram ranccom inport randint 
fram rath inport sqt 


Gef factoring (n): 
'"' 对 大 数 进行 因数 分 解 ''' 
if not jsinstance (nN, int): 
Print ('You mst give me an integer') 
IEtum 
和 研 始 分 解 ,把 所 有 因数 都 添加 到 resut 列表 中 
result =[] 
for p in primes: 
whilen!3: 
if np==0: 
nn 
result .agpend (p) 
else: 
break 
else: 
result =" * .join rep (str, result) ) 
retum result 
柳 虑 参数 本 身 就 是 素数 的 情况 
if nct result: 
rebmn 


testpata =[randint (10,100000) for i in range (50)] 

村 机 数 中 的 最 大 数 

exData -ex (testData) 

放 \ 于 mezpata 的 所 有 素数 

Primes =[ P for P in range CrexData) if 0 nct in 
[psd for d in range@,int (sqt (p)) #1)] ] 


for Gata in testpata: 
r factoring (Gata) 
Print (Gata, ' =",7) 
抽 试 分 解 结果 是 否 正 确 
Print (Gata ==eval (7)) 
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示例 5-11 编写 函数 模拟 猜 数 游戏 。 系 统 随 机 产生 一 个 数 , 玩 家 最 多 可 以 猜 5 次 , 系 
统 会 根据 玩家 的 猜测 进行 提示 ,玩家 则 可 以 根据 系统 的 提示 对 下 一 次 的 猜测 进行 适当 
调整 。 


fram random import randint: 


Gef guess (rexValue 3100,mexTimes =5) : 
荐 机 生成 一 个 整数 
Value =randint (1 ,meaxvalue) 
for i in range ezxrimes) : 
Erapt ='Start to Guess:' if 工 ==-0 else 'Gness again:' 
芋 用 异常 处 理 结构 ,防止 输入 不 是 数字 的 情况 
try: 
x =int (irput rarpt)) 
exopt: 
int (Mist irput an integer between 1 and ',mexValue) 
else: 


print (moo littie') 
else: 
钦 数 用 完 还 设 猜 对 ,游戏 结束 ,提示 正确 答案 
print (Game oer. FAIL.') 
Print ('The velue is ',value) 

示例 5-12 ”编写 因数 ,计算 形式 如 a +aa +aaa +aaaa +… +aaa…aaa 的 表达 式 的 值 ， 
其 中 a 为 小 于 10 的 自然 数 。 


def daro (vn) : 
assert type (n) = 一 nt and 0 <v <10, "v must be integer between 1 and 9， 
result,t =0,0 
fer i in range (Nn): 
t=t*10 4 
result + 十 
retim result 


Print (Gemp (3,4)) 


示例 5-13 编写 函数 模拟 报 数 游戏 。 有 n 个 人 围 成 一 圈 , 顺 序 编号 ,从 第 一 个 人 开始 
从 1 到 k( 假 设 k=3) 报 数 ,报到 k 的 人 退出 圈子 ,然后 圈子 缩小 ,从 下 一 个 人 继续 游戏 , 问 
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最 后 留 下 的 是 原来 的 第 几 号 。 
fram itertools import cycle 


cef cero (1st,h) : 
制 片 ,以 免 影 响 原来 的 数据 
t 1st st[:] 
谢 戏 一 直 进行 到 只 剩 下 最 后 一 个 人 
while len(t 1st) 1: 
创建 cycle 对 象 
c=cyclett_ 1st) 
从 1 到 kk 报 数 
for i in range (0 : 
七 est (c) 
#- 个 人 出 局 ,圈子 缩小 
incex at 1st.index(t) 
t lstt 1st[index:] CE 1st[:index] 
闹 戏 结束 
rebumt 1st[0] 


1st ist (range (1,11)) 

Print (Garo (1st,3)) 

示例 5-14 汉 诺 塔 问题 基于 递归 算法 的 实现 。 

据说 古代 有 一 个 焚 塔 , 塔 内 有 3 个 底座 A、B、C,A 座 上 有 64 个 盘子 ,盘子 大 小 不 等 ， 
大 的 在 下 ,小 的 在 上 。 有 一 个 和 尚 想 把 这 64 个 盘子 从 A 座 移 到 C 座 , 但 每 次 只 能 允许 移 
动 一 个 盘子 ,在 移动 盘子 的 过 程 中 可 以 利用 B 座 , 但 任何 时 刻 3 个 座 上 的 盘子 都 必须 始 
终 保 持 大 盘 在 下 .小 盘 在 上 的 顺序 。 如 果 只 有 一 个 盘子 , 则 不 需要 利用 B 座 , 直 接 将 盘子 
从 A 移动 到 C 即 可 。 和 尚 想 知道 这 项 任务 的 详细 移动 步骤 和 顺序 。 这 实际 上 是 一 个 非 
常 巨 大 的 工程 ,是 一 个 不 可 能 完成 的 任务 。 根 据 数学 知识 我 们 可 以 知道 ,移动 n 个 盘子 需 
要 2" -1 步 ,64 个 盘子 需要 18 446 744 073 709 551 615 步 。 如 果 每 步 需 要 一 秒 的 话 ,那么 
就 需要 584 942 417 355.072 年 。 


Cef harnoi (nm, src,dst, teap =None) : 

上 辣 明 用 来 记录 移动 次 数 的 变量 为 全 局 变量 

中 cbal times 

次 认 参数 类 型 和 范围 

assert type (um) ==int, nm must be an integer' 

assert nm >0, ‘nm mst 30" 

如 剩 最 后 或 只 有 一 个 盘子 需要 移动 ,这 也 是 函数 递归 调用 的 结束 条 件 

if nm= 酉 : 
Print ("The {0} Times mve:{1} ==>{2}" .fomat (times, src,dst)) 
times + 本 

else: 
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府 归 调用 函数 自身 
紫 把 除 最 后 一 个 盘子 之 外 的 所 有 盘子 移动 到 临时 柱子 上 
Pennoi (um 1, src, tenp, dst) 
把 最 后 一 个 盘子 直接 移动 到 目标 柱子 上 
hannoi (, src,dst) 
把 除 最 后 一 个 盘子 之 外 的 其 他 盘子 从 临时 柱子 上 移动 到 目标 柱子 上 
Pannoi um +1, tenp, dst, src) 
明 来 记录 移动 次 数 的 变量 
times 梧 
好 表示 最 初 放置 盘子 的 柱子 ,C 是 目标 柱子 ,B 是 临时 柱子 
harnoi G, 'A', 'C', 'B') 


示例 5-15 汉 诺 塔 问题 基于 非 递 归 算 法 的 实现 (感谢 国防 科技 大 学 刘 万 伟 老师 提供 
本 案例 算法 和 第 一 版 本 的 代码 ) 。 


Gef hannoi (n) : 
提 来 记录 移动 过 程 中 每 个 盘子 的 当前 位 置 
制 始 都 在 A 柱子 上 , 即 chr(e5 +0) 
L=[O0]* n 
如 个 扒 子 一 共 需 要 移动 > 了 “次 才能 完成 
for i inrange(l,2* *n): 
根 设 盘子 编号 分 别 为 0,1,2,…,n 民 
第 工 步 应 该 移动 的 盘子 编号 
是 好 是 主 的 二 进 制 形式 中 最 后 连续 的 0 的 个 数 


b i=pin(i) 
janb i) Di.rfinm(1') 1 
print(' 第 ' +str(i) +' 步 :移动 盘子 ' +str 和 要),chr(65 世 0D])， ->',end="' ') 


凤 A.B.C 三 根 柱子 摆 成 三 角形 

怒 第 j 个 盘子 移动 到 下 一 根 柱子 上 

根据 j 的 奇偶 性 决定 是 顺 时 针 移 动 还 是 逆 时 针 移 动 
LG]=(C[j] #1)%3 if js%2=30 else CL[j] +2)%3) 

古 一 根 柱子 ,这 里 5 是 A 的 zscII 码 

Print (hr (65 +L[j])) 


hannoi (3) 
示例 5-16 ”编写 函数 计算 任意 位 数 的 黑洞 数 。 黑 洞 数 是 指 这 样 的 整数 : 由 这 个 数字 
每 位 上 的 数字 组 成 的 最 大 数 减 去 每 位 数字 组 成 的 最 小 数 仍然 得 到 这 个 数 自身 。 例 如 ,3 
位 黑洞 数 是 495 ,因为 954 -459 =495 ,4 位 数字 是 6174 ,因为 7641 - 1467 =6174。 
Cef rain on) : 
5 参数 n 表 示 数 字 的 位 数 ,例如 n 汉 时 返回 495,n 翼 时 返回 6174'"" 
特 测试 数 范围 的 起 点 和 结束 值 


start A0**(n 1) 
erd0*n 
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灰 次 测试 每 个 数 
for i in range (startvenc) : 
机 这 几 个 数字 组 成 的 最 大 数 和 最 小 数 
big="" .join (sorted (str (i) ,reverse <True)) 
little="' .join (reversed (big)) 
big, little ep (lint, (ig, little)) 
ifbig -little= 直 : 
Print (i) 
nA 
main n) 
示例 5-17 24 点 游戏 是 指 随机 选取 4 张 扑 克 牌 (不 包括 大 小 王 ) ,然后 通过 四 则 运算 
来 构造 表达 式 , 如 果 表 达 式 的 值 恰 好 等 于 24 就 赢 一 次 。 下 面 的 代码 定义 了 一 个 函数 用 来 
测试 随机 给 定 的 4 个 数 是 否 符合 24 点 游戏 规则 ,如 果 符 合 就 输出 所 有 可 能 的 表达 式 。 


fram ranccom inport randint 
fram itertcols inport Permmutaticns 


要 个 数字 和 2 个 运算 符 可 能 组 成 的 表达 式 形式 
EAp5=('((%5%5%5) Ss%5) $s%s', 

'(%SsS%S%5s) $s (%s%s%s)', 

‘(Ss%s (Ss%s%s)) Ss%s', 

'%S5%S5 ((%S5%Ss%5) Ss%s)', 

"sg%s (人 5%s (Hs%s%s))') 
sr'+-*/" 


Gef test24(w : 
result =[] 
fythcn 允许 函数 的 嵌 套 定义 
伏 个 函数 对 字符 串 表 达 式 求 值 并 验证 是 否 等 于 24 
def check (ep) : 
try: 
才 可 能 会 出 现 除 以 0 异常 ,所 以 放 到 异常 处 理 结构 中 
retum int (eval (ep)) ==24 
exoept: 
retum False 
丛 排 列 , 枚 举 4 个 数 的 所 有 可 能 顺序 
for a in Pemrmutaticns (Vv) : 
得 找 4 个 数 的 当前 排列 能 实现 24 的 表达 式 
t=[ep $ (a[o],opl,a[lll, qe,al2],q3,al3]) for qd in qps for GEP in qps for qp3 in aps for 
ezp in eqs if eck (ep % (alol, plsalll, qe,al2],qp3,a[l3]))] 
ift: 
result.append (t) 
retum result 
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for i in range (0): 
Print (' =" * 20) 
硅 成 随机 数字 进行 测试 
1st =[randint 0,14) for j in range (4)] 
r=test24 (1st) 
证 吕 
print (r) 
else: 
Print ('ND answer for ',1st) 
示例 5-18 八 皇 后 问题 。 八 皇后 问题 是 高 斯 提出 来 的 ,是 一 个 经 典 的 回溯 算法 问题 ， 
其 核心 为 : 在 国际 象棋 棋盘 (8 行 8 列 ) 上 摆 放 8 个 皇后 ,要 求 8 个 皇后 中 任意 两 个 都 不 
能 位 于 同一 行 .同一 列 或 同一 斜 线 上 。 


GEf isvalid(s,o01): 
"这 个 函数 用 来 检查 最 后 一 个 皇后 的 位 置 是 否 合法 
档 前 皇后 的 行 号 
row len(s) 
检查 当前 的 皇后 们 是 否 有 冲突 
for rrc in enumerate (s) : 
如果 这 一 列 已 有 皇后 ,或 者 某 个 皇后 与 当前 皇后 的 水 平 与 垂直 距离 相等 
艇 表示 当前 皇后 位 置 不 合法 ,不 允许 放置 
if c==00l or abs (row -rT) 一 =bs (col 一 ) : 
Tetmm False 
IEtum True 


Gef qheennvs 一 ()): 
"这 个 函数 返回 的 结果 是 每 个 皇后 所 在 列 号 '"" 
刀 是 最 后 一 个 皇后 ,保存 本 次 结果 


证 len(s) 一 =: 
retum [s] 
res=[] 


for col in range (n): 
if not jsvaliq(s,col) : ccntino 
for r in qeen(n,s +(col,)): 

res.arppend (r) 
rebim res 


彤 式 转换 ,最 终结 果 中 包含 每 个 皇后 所 在 的 行 号 和 列 号 

result =[[(r,c) for rrc in enmerate(s)] for s in qeen(8)] 

得 出 合法 结果 的 数量 

Print Qen (result)) 

翰 出 所 有 可 能 的 结果 ,也 就 是 所 有 皇后 的 摆 放 位 置 

符 果 中 每 个 皇后 的 位 置 是 一 个 元 组 ,里 面 两 个 数 分 别 是 行 号 和 列 号 
for r in result: 
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print (r) 


示例 5-19 ”编写 函数 ,模拟 兑换 零钱 。 给 定 一 个 数 ,然后 兑换 成 指定 面值 的 零钱 , 求 


解 所 有 可 能 的 兑换 方法 ,每 个 零钱 可 以 使 用 多 次 。 


Cef mekehanges (total, hanges =(1,2,5,10,20, 50,100) , result None): 
if result is Nene: 
result =[] 
if total ==0: 
Yield result 
for hange in chances: 
嫉 换 的 零钱 不 能 超过 总 金额 ,并 且 每 个 结果 是 唯一 的 
if hange >total or (en (result) >0 and result[ 1] <chanoP) : 
cntirnne 
for r in mkehanges (total -hange, hanges, result +[hange]) : 
yieldr 
抽 | 试 
for way in rekechances (35) : 
Print (way) 


示例 5-20 ”编写 函数 ,查找 序列 元 素 的 最 大 值 和 最 小 值 。 给 定 一 个 序列 ,返回 一 个 元 


组 ,其 中 元 组 第 一 个 元 素 为 序列 最 大 值 , 第 二 个 元 素 为 序列 最 小 值 。 


def ryMaxMin (itersble) : 
"返回 序列 的 最 大 值 和 最 小 值 '"'' 
tMax =tMin =iterable[0] 
for item in iterable[l:]: 
if item >tMax: 
tMax =item 
elif item<tMin: 
tMin =item 


Tetum (tMax, tMin) 
示例 5-21 编写 函数 ,模拟 内 置 函 数 all( ) ,any() 和 zip()。 


def nyAll (itersble) : 
" 噶 拟 内 管 函 数 aal0'"' 
机 要 有 一 个 元 素 等 价 于 False, 返 回 False 
for item in itersble: 
if not item: 
retim False 
如 果 所 有 元 素 都 等 价 于 True, 返 回 True 
rsetm Troe 


Ef rmny (iterable) : 





152 > Python 程序 设计 开发 宝典 
霹 


"模拟 内 管 函 数 ay07 和 7 
可 要 有 一 个 元 素 等 价 于 True 返回 Tne 
for item in itersble: 
if item: 
retim True 
如 果 所 有 元 素 都 等 价 于 False, 返 回 False 
TEbum False 


GEf myzip (terables) : 
"模拟 内 管 函 数 zip0'"" 
雁 取 所 有 和 迭代 对 象 的 最 小 长 度 
rin length =min (rep (lenviterables)) 


核 次 返回 所 有 和 帮 代 对 象 中 对 应 位 置 上 元 素 组 成 的 元 组 
for i in range tmin lengtb) : 
Yield bple( (it[i] for it in iterapbles)) 
示例 5-22 编写 函数 ,使 用 非 递 归 算 法 实现 冒 泡 排 序 算法 。 
fram randam inrport randint 


GEf pubplesort (1st, reverse =False) ; 
length <len (1st) 
for i in range (0, length) : 
fag False 
fr j in range (0, length -i 711): 
此 较 相 邻 两 个 元 素 大 小 ,并 根据 需要 进行 交换 
妖 认 升序 排序 
epP="'1st[j] >1st0j 1]' 
苔 果 reverse -True 则 降序 排序 
if reverse: 
epPp="1st 0D] st #1" 
if eal (ep) : 
1st[j],1st0 1] st ,1st[0j] 
所 ag -True 表示 本 次 扫描 发 生 过 元 素 交换 
flag “Tre 
茹 果 一 次 扫描 结束 后 ,没有 发 生 过 元 素 交 换 ,说明 已 经 按 序 排列 
if not flag: 
break 


lst=[randint ( ,100) for i in range (20)] 
print (‘Before sort: \n',1st) 
iblesort (1st, True) 

Print ('After sort: n',1st) 
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示例 5-23 ”编写 函数 ,使 用 递归 算法 实现 冒 泡 排 序 算 法 。 
fram rancbm inport randint 


Gef bplesort (1st,end one, reverse =False) : 
if erd=Aone: 
length <len (1st) 
else: 
length =ena 
if length<34: 
IEtum 
让 sg 用 来 标记 本 次 扫描 过 程 中 是 否 发 生 了 元 素 的 交换 
flag False 
for j in range (length 71) : 
此 较 相 邻 两 个 元 素 的 大 小 ,并 根据 需要 进行 交换 
办 认 升序 排序 
epP="1st[j] >st0j #1]" 
扣 果 reverse =True 则 降序 排序 
if reverse: 
epP="1st[j] <st[j #1" 
if eval (ep) : 
1st[j],1st[ #1] st[j #1],1st[j] 
flag=True 
若 果 没有 发 生 元 素 交换 , 则 表示 已 按 序 排列 
if flag==False: 
retim 
else: 
寻 剩 余 的 元 素 进 行 排序 
hiblesort (1st, length -1, reverse) 


删 试 

1st =[randint (1,100) for i in range (20)] 
Print ('Before sorted: \n',1st) 

群 序 排序 

ubblesort (1st) 

妖 序 排序 
dblesort (1st, reverse =True) 

Print ('After sorted: \n',1st) 


示例 5-24 ”编写 函数 ,模拟 选择 法 排序 。 


GEf selectsort (1st, reverse =False): 
length en (st) 
for i in range 0, length) : 
息 设 剩余 元 素 中 第 一 个 最 小 或 最 大 
m= 


好 描 剩余 元 素 
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for j in range (i #11,1ength): 
瘦 果 有 更 小 或 更 大 的 ,就 记录 下 它 的 位 置 
ep='stD] <stIm" 
if£ reverse: 
epP="1st [0] >stm' 
if eval (ep): 
mo 
上 阁 果 发 现 更 小 或 更 大 的 ,就 交换 值 
ifma=i: 
1st[i],1st [tm <st (ml,1st[i] 


示例 5-25 编写 函数 ,模拟 二 分 法 查找 。 

二 分 法 查找 算法 非常 适合 在 大 量 元 素 中 查找 指定 的 元 素 , 要 求 序列 已 经 排 好 序 (这 
里 假设 按 从 小 到 大 排序 ) ,首先 测试 中 间 位 置 上 的 元 素 是 否 为 想 查 找 的 元 素 ,如果 是 则 结 
束 算 法 ;如 果 序 列 中 间 位 置 上 的 元 素 比 要 查找 的 元 素 小 , 则 在 序列 的 后 面 一 半 元 素 中 继续 
查找 ;如 果 中 间 位 置 上 的 元 素 比 要 查找 的 元 素 大 , 则 在 序列 的 前 面 一 半 元 素 中 继续 查找 。 
重复 上 面 的 过 程 ,不 断 地 缩小 搜索 范围 ,直到 查找 成 功 或 者 失败 (要 查找 的 元 素 不 在 序 
列 中 ) 。 


ena=en (st) 
while start <end: 
寻 算 中 间 位 置 
micde=(start +end) //2 
但 找 成 功 ,返回 元 素 对 应 的 位 置 
迁 value= 导 stImicmel] : 
retum mice 


首 前 面 一 半 元 素 中 继续 查找 
elif valve <lst [middle]: 
end=middle 了 1 
查找 不 成 功 ,返回 False 
retim False 
fram ranccm jmport randint 


1st =[randint (1,50) for i in range C0)] 
1st.sort () 
Erint (st) 
result -hinarysearch (1st,30) 
if result ! =False: 

Print ("Sucoess, its positian is:',result) 
else: 
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Print ('Fail. Not exist.') 
标准 库 bisect 实现 了 二 分 法 查找 和 插入 的 有 关 功 能 ,其 中 的 bisect_left( ) 和 bisect_ 
right( ) 方 法 可 以 用 来 定位 在 一 个 有 序列 表 中 插入 指定 元 素 而 保持 新 列表 有 序 的 正确 位 
置 , 如 果 原 列表 中 已 存在 要 插入 的 元 素 ,那么 bisect_left( ) 返 回 已 有 元 素 前 面 紧邻 的 位 置 ， 
而 bisect_right( ) 返 回 已 有 元 素 后 面 紧 邻 的 位 置 ;insort_left( ) 和 insort_right( ) 则 直接 在 正 
确 的 位 置 插入 新 元 素 并 且 保 持 新 列表 有 序 。 


>>>import bisect 
>>>1st Aist (range (10)) 覃 建 列表 

>>>1st 

[0,1,2,3,4,5,6,7,8,9] 

>>>bisect .bisect left (1st,5) 雁 取 需要 搬入 的 新 元 素 的 正确 位 置 
5 

>>>bisect .bisect right (1st,5) 

6 

>>>bisect .bisect left (1st,5.5) 

6 

>>>bisect .bisect right (1st,5.5) 

6 

>>>1st.insert (6,5.5) 睛 入 新 元 素 

>>>bisect.insort. left (1st,7.9) 睛 入 新 元 素 

>>>1st 

[0,1,2,3,4,5,5.5,6,7,7.9,8,9] 


示例 5-26 编写 函数 ,使 用 递归 法 实现 二 分 法 查找 。 
fram random inrport randint 


Gef binarysearch (1st, start,end, value) : 
而 表 中 不 存在 要 查找 的 元 素 
if start >end: 
retim False 
竺 搜索 区 间 的 中 间 位 置 和 该 位 置 上 的 值 
mid=(start +eng) // 2 
micvalue =1st [mid] 
械 到 了 
庄 micvalue 一 一 alue: 
IEtuomm mid 
elif micvalue >wvalue: 
三 前 一 半 元 素 中 查找 
retim binaryseearch (st, start,mid -1,value) 
else: 
症 后 一 半 元 素 中 查找 
retim binaryseerch (1st,mid #1,end,value) 
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lst=[randint (1,50) for i in range (C0)] 
1st.sort () 
Print (1st) 
result =binarysearch (1st,0,20,30) 
if result ! =False: 

Erint ('Suooess, its Positicn is:', result) 
else: 

Print ('Fail. Not exist.') 


示例 5-27 编写 函数 ,模拟 快速 排序 算法 。 
fram rancom inrport randint 


GEf quicksort (1st, reverse -False) : 
if len(lst) <3: 
retim 1st 
坎 认 使 用 最 后 一 个 元 素 作为 枢 点 
pivot ast .pp() 
first, secoand=[], [] 
雁 认 使 用 升序 排序 
ep='x<=pivot' 
everse=True 表示 降序 排列 
if reverse ==True: 
ep='x>=pivot' 
for x in lst: 
first.append (x) if eval (ep) else seocnd.append (x) 
姓 归 调用 
retim quicksort (first, reverse) +[pivot] +quicksort (ssconc reverse) 


1st =[randint (1,1000) for i in range (10)] 
Print (quicksort (1st, True)) 


上 面 的 代码 思路 非常 清晰 ,不 过 空间 开销 比较 大 ,如 果 使 用 经 典 的 快速 排序 算法 的 
话 ,代码 可 以 像 下 面 这 样 写 : 
GEf quicksort (x, start,end) : 


if start >=end: 
Tetam 


i=start 

j=ed 

苇 用 第 一 个 元 素 作为 枢 点 
key =x [start] 


while i <j: 
扒 后 向 前 寻找 第 一 个 比 指定 元 素 小 的 元 素 
while i < and x0j] > ey: 
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j -也 
x[i] =x[j] 


扒 前 向 后 寻找 第 一 个 比 指定 元 素 大 的 元 素 
while i < ard x[i] <=Ey: 

+ 导 
x[j] =x[i] 


x[i] ey 
hicksort (x, start,i 71) 
quicksort (i ,end) 


示例 5-28 ”编写 函数 ,实现 侏 傅 排 序 算法 。 


GEf gncomesort (lst) : 
i 
lergth =len (1st) 
while i <lergth: 
柯 头 看 ,如 果 当 前 元 素 比 前 面 的 大 或 者 相等 ,就 继续 往 前 走 
ifi=30 or 1st[i 11] <ast[i]: 
站 
else: 
凤 果 当前 元 素 比 前 面 的 小 ,就 交换 位 置 ,然后 后 退 一 步 
1st[i -1],1st[i] 3st[i],1st[i 1] 


i- 习 
示例 5-29 编写 函数 ,实现 归并 排序 算法 ,并 进行 测试 。 
inport ranccm 
GEf mergeSort (secy reverse =False) : 

杷 原 列 表 分 成 两 部 分 


rmida=en(segq) //2 
left, right =seq[:mid] ,seqlmid:] 


根据 需要 进行 递归 
if len(left) 41: 

left =mergesort (left) 
证 len(right) 习 : 

right =mergeSort (right) 


岗 在 前 后 两 部 分 都 已 排序 
央行 合并 
tap=[] 
while left and right: 
if left[ 1] >=right[ 1]: 
tamp.arpend (eft .pp 0) 
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Slse: 
terp.append (right .pgp0) 
tep.reverse0 
TeEsult=Qeft or right) -+tenp 


根据 需要 进行 逆序 
if reverse: 
1,j=0,len(result) 1 
while i <j: 
result [i], result j] result [j],resut [i] 





for i in range (100000) : 
性 成 随机 测试 数据 
reverse =randam.dhoice( (True, False)) 
X=[randam.randint (,100) for i in range (20)] 
Yy =Sorted (x, reverse =reverse) 
X=nergeSort (x, reverse) 
if x! =y: 
Print (‘error') 
示例 5-30 ”编写 函数 ,使 用 递归 法 和 回溯 法 生成 不 重复 数字 构成 的 所 有 整数 。 


data ple (range (10)) 


GEf dempl (Gata,k,s=()): 

过 归 法 习 " 
if len(s) == and s[0] !-0: 

Print (eval ('' .join trap (str, 5)))) 
else: 

for jitem in data: 

if item nct in s: 
Gaml (cata,k,s +(item, )) 


Sef cence (cata, Kk,s=()): 
"回溯 法 
if len(s) == and s[0] !-0: 
Print (eval ('' .join mep (str,s)))) 
res=[] 
for item in data: 
if item in s: 
antine 
for r in demcP (data,k,s +(item, )): 
res.apend (r) 
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借助 于 Python 标准 库 itertools 中 的 permutations( ) 函数 可 以 更 直观 地 解决 本 例 的 问题 。 


GEf dar3 (Gata, RP) : 
""" 使 用 排列 产生 任意 位 数 的 数字 ""' 
fram itertools inport Permmutaticns 
r=pemtations (cata, k) 
for item in r: 
if item[0] ! <0: 
Print (eval ('' .join (rep (str, iten ))) 


示例 5-31 编写 函数 ,查找 给 定 序 列 的 最 长 递增 子 序列 。 
fram itertools inport ombinations 
fram rancom inport sanple 


GEf sibnscencingList (1st) : 
返回 最 长 递增 子 序列 
for length in range (len (lst) ,0, 1): 
碗 长 度 递 减 的 顺序 进行 查找 和 判断 
for sib in conibinaticns (1st, length) : 
出 断 当前 选择 的 子 序 列 是 否 为 递增 顺序 
if list (sab) ==sorted (sp) : 
虐 到 第 一 个 就 返回 
Tetom ab 


def getList (start -0,end 4000, nmiber -20) : 
"生成 随机 序列 ''' 
让 nmiber >enq -start: 
Tebum None 
retim sanple (range (start,end) ,mariber) 


Gef main(): 
1st =getList (nber 0) 
if lst: 
Erint Qst) 
Print (sjibmscenciingrist (1st)) 
rain() 
示例 5-32 ”编写 函数 ,寻找 给 定 序列 中 相差 最 小 的 两 个 数字 。 
jimport rancbm 
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def getrwoclosestElerents (seq) : 

读 进 行 排序 ,使 得 相 邻 元 素 最 接近 
相差 最 小 的 元 素 必然 相 邻 
seq =sorted (seq) 
谍 穷 大 
if =Hoat (‘inf') 
妨 历 所 有 元 素 , 两 两 比较 ,比较 相 邻 元 素 的 差 值 
棱 用 选择 法 寻找 相差 最 小 的 两 个 元 素 
fer ivv in erymerate (seq[: 1]): 

d=abs(v -seq[i #1]) 

ifd<dif: 

first, secoond, dif =v, seq[i #1],d 

是 回 相 差 最 小 的 两 个 元 素 
Tetum (first,sscong) 


seq=[rancom.rancom() for i in range (20)] 
Print (seq) 

Print (sorted (seq) ) 

Print (getTwcCloeestElements (seq) ) 


示例 5-33 ”编写 函数 ,计算 给 定 信 息 序列 的 炉 。 

信息 炉 可 以 用 来 判定 指定 信 源 发 出 的 信息 的 不 确定 性 ,信息 越 是 杂乱 无 章 毫 无 规律 ， 
信息 业 就 越 大 。 如 果 某 信 源 总 是 发 出 完全 一 样 的 信息 ,那么 灶 为 0, 也 就 是 说 信息 是 完全 
可 以 提前 预测 和 确定 的 。 


fram reth jimport log 
fram ranccm inrport randint 


GEf infomreticnEmntropy (1st): 
散 据 总 个 数 
mum=len (lst) 
每 个 数据 出 现 的 次 数 
his=dict() 
for data in 1st: 
his[data] =his.get (cata,0) 4 
打印 各 数据 出 现 的 次 数 , 以 便 核对 
print nis) 
上 回 信息 灶 , 其 中 x/mm 为 每 个 数据 出 现 的 频率 
retum abs (sm (trep (1anbda x: x/nm* 10g(x/rum,2) ,his.values ()))) 


功能 测试 

for i in range (10): 
1st =[randint (1,5) for i in range (randint (5,30))] 
Print (‘Entropy: ', infomatiorentropy (1st)) 
Print (' =" * 20) 
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遇 有 任何 变化 的 信息 序列 ,这 里 输出 的 箭 应 该 为 0 
Print (Entropy: ', infomaticrentropy ([1,1,1,1,1,1])) 


示例 5-34 编写 函数 ,计算 任意 字符 串 信 息 的 哈 夫 曼 编 码 。 


fram itertools import oont 

fram collecticns import Counter 

fram ranccm import choice 

framn string import ascii letters,digits 


Gef huffiren (seqg, frq) : 
和 侠 里 的 comt 0 依次 生成 0,1,2,3,4,… 
娃 要 用 来 和 人 堆 时 保持 顺序 
mum=ccount () 
好 原始 列表 进行 堆 化 
trees =1ist (zip (frgy num, se9) ) 
heapify (trees) 
while len(trees) 341: 
群 出 堆 中 频次 最 少 的 两 个 元 素 
# 表 示 不 关心 这 个 值 
fa,_,a eappop (trees) 
fh,_,b eappop (trees) 
始 并 后 生成 新 节点 ,重新 入 堆 
hesppush (tress, (fa +fb, next (um) , [a,b])) 


版 回 建 好 的 二 又 树 
retim trees[0] [ -1] 


def codes (tree,prefix=""): 
if len(tree) =3: 
寻 意 ,这 里 不 能 合并 成 一 个 zebam (tres,prefi;) 语 句 
Yield (tree,prefix) 
rebm 
本 叉 树 左边 节点 编码 为 0, 右 边 节点 编码 为 1 
for bit, child in zip('01', tres) : 
帮 父 节点 编码 基础 上 , 接 上 每 个 节点 的 编码 
for pair in oodes (chilg, prefix +bit) : 
Yield pair 


def main (seag) : 
统计 各 字符 频次 
coal ta 
temp =Counber (seq) 
答 里 只 是 为 了 让 输出 结果 更 直观 ,但 实际 上 会 影响 效率 
for item in sorted (terp.items 0 ,key larbda x: x[1], reverse True) : 
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Print item 
print (' =" * 20) 
根据 各 字符 出 现 的 频次 ,生成 哈 夫 曼 树 
seq ist (tarp.keys 0) 
frq=[tenp[t] for t in seq] 
tree uffiren (segy fg 
根据 哈 夫 曼 树 ,返回 各 字符 编码 的 生成 器 对 象 
retbum coces (tree) 


letters =escii letters +digits 
augrength-0 
柱 成 随机 字符 串 ,模拟 信 源 信号 
Seq="' .join( (dpioe (letters) for i in TengeQ00))) 
print (seq+"' \n' +' =" * 20) 
帕 编 码 长 度 从 小 到 大 输出 
位 里 只 是 为 了 让 输出 结果 更 直观 ,但 实际 上 会 影响 效率 
for item in sorted train (seq) ,key Jlarbda x: len (x[1])): 
Print (item) 
sugrength +=tamp.get (item[0]) * len(item[1]) 


峙 算 并 输出 平均 码 长 
Print (avgrength/len (seq) ) 


示例 5-35 编写 函数 ,使 用 筛选 法 求解 小 于 指定 整数 的 所 有 素数 。 


Gef primes nextniber) : 
"筛选 法 获取 小 于 maxNmiber 的 所 有 素数 '"' 
竺 判断 整数 
lst <list (range (3,mexNiniber,2)) 
概 大 整数 的 平方 根 
m=int (rexNuriber * 浊 .5) 
for incex in range (Mm) : 
Currert =1st [index] 
效果 当前 数字 已 大 于 最 大 整数 的 平方 根 ,结束 判断 
if current >m: 
break 
峙 该 位 置 之 后 的 元 素 进 行 过 滤 
lst[index #1:] <ist (filter (lanbda x: x% carrent! =0,1st[index #1:])) 
理 也 是 素数 
retim [2] Hst 


Print (crimes (1000)) 
示例 5-36 ”模拟 整数 乘法 的 小 学 竖 式 计算 方法 。 
"小 学 整数 乘法 竖 式 计算 示例 
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def ml avb) : 
"小 学 竖 式 两 个 整数 相 乘 的 算法 实现 
由 两 个 整数 分 离开 成 为 各 位 数字 再 逆序 
sa ist ep (int, reversed (str (a)))) 
Hp <ist trep (int, reversed (str (Po) ))) 


四 位 整数 和 mm 位 整数 的 乘积 最 多 是 nm 位 整数 
result =[0] *(len (aa) Hen (cb)) 


惧 小 学 整数 乘法 竖 式 计算 两 个 整数 的 乘积 
for ia,va in emerate (aa) : 
此 表示 进位 ,初始 为 0 
cn 
for jbpvvb in enumerate (db) : 
fythcn 中 内 管 函 数 divmpa0 可 以 同时 计算 整 商 和 余数 
Cresult [ia +ib] -ivmodtva* 如 b+c +result [ia +ib],10) 
九 高 位 的 余数 应 进 到 更 高 位 
result[ia+ibp#] 一 


整理 , 变 成 正常 结果 
result =int ('' .join (rep (str, reversed (result)))) 
retim result 


出 试 
for i in range (100000) : 
a=randint (1,1000) 
b=randint (1,1000) 
ram (ab) 
ifr!iaa*b: 
Print (a,b, r, "error') 


示例 5-37 使 用 候 山 算法 和 模拟 退火 算法 分 别 寻 找 列 表 中 的 最 大 元 素 , 并 比较 两 种 


算法 的 性 能 优 劣 。 
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候 山 算法 是 人 工 智 能 算法 的 一 种 ,特点 在 于 局 部 择优 ,所 以 不 一 定 能 够 得 到 全 局 最 优 
解 , 尽 管 效 率 比 较 高 。 使 用 息 山 算法 寻找 序列 最 大 值 的 思路 是 : 在 能 看 得 到 的 局 部 范围 
内 寻找 最 大 值 ,如 果 当 前 元 素 已 经 是 最 大 值 就 结束 ,如 果 最 大 值 仍 在 前 面 就 往 前 移动 到 该 
最 大 值 位 置 ( 往 上 疏 ) ,重复 上 面 的 过 程 。 如 果 原 始 数据 的 大 小 和 分 布 类 似 于 双 峰 图 或 多 
峰 图 的 话 , 那 么 从 一 个 方向 开始 息 山 的 话 就 可 以 找到 全 局 最 大 值 ,并 且 能 节省 一 些 时 间 。 
而 另 一 个 方向 可 能 无 法 找到 全 局 最 大 值 ,只 能 找到 局 部 最 大 值 , 除 非 把 * 邻 域 "定义 的 非 
常 大 ,但 是 如 果 邻 域 定义 的 非常 大 的 话 会 严重 影响 算法 效率 。 

模拟 退火 算法 可 以 看 作 是 怜 山 算法 的 一 种 改进 ,如 果 前 方 有 更 优 解 就 前 进 , 如 果 没 有 
更 优 解 就 以 一 定 概 率 前 进 。 与 简单 的 仆 山 算法 相 比 ,模拟 退火 算法 有 可 能 跳出 局 部 而 得 
到 全 局 最 优 解 ,但 也 有 可 能 得 到 更 差 的 解 ,算法 参数 的 设置 非常 重要 。 


fram rancom inrport randint, randam 





ef hilIMax (1st, howEar) : 
"中 山 算法 
1st: 待 确定 最 大 值 的 列表 
howFar: 候 山 时 能 看 到 的 "最 远方 ", 越 大 越 准 确 '"' 
册 于 切片 是 左 闭 右 开 区 间 , 所 以 howgar 必须 大 于 1 
assert howEar 31, "howEar mst 31' 


类 列表 第 一 个 元 素 开始 息 
如 果 已 经 到 达 最 后 一 个 元 素 , 或 者 已 找到 局 部 最 大 值 ,结束 


malst[start] 
loc =alst [start #1 :start thowFar] 
marax (10c) 
if m>m: 

Tetbum m 
else: 
幅 部 最 大 数 的 位 置 
rEos =10c.index om) 
Start +=AmEos 


Cef simnneal ingMerx (st,howEar) : 
"模拟 退火 算法 ,与 粗暴 的 鼻 山 算法 相 比 ,有 可 能 跳出 局 部 而 获得 全 局 最 优 解 ， 
也 有 可 能 会 因为 忽略 当前 的 局 部 最 优 解 而 得 到 更 差 的 解 ,参数 设置 很 重要 
Jst: 待 确定 最 大 值 的 列表 
powear: 有 息 山 时 能 看 到 的 "最 远方 ", 越 大 越 准确 '"" 
在 于 切片 是 左 闭 右 开 区 间 , 所 以 howEst 必须 大 于 1 
assert howEar 31, "Parameter "howEar" must 习 " 
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崔 列 表 第 一 个 元 素 开 始 疏 
襄 果 已 经 到 达 最 后 一 个 元 素 ,或 者 已 找到 局 部 最 大 值 ,结束 
start -0 
Aan(st) 
婧 机 走动 的 次 数 
times 酉 
while start < 司 1: 

当前 局 部 最 优 解 

malst [start] 

证 一 个 邻 域内 的 数字 

loc <1st [start #1 :start thowFar] 

茹 果 已 处 理 完 所 有 数据 ,结束 

if not loc: 

retumm 

本 一 个 邻 域 的 局 部 最 优 解 及 其 位 置 

mrex (10c) 

mEos =10c. index mm 

如 果 下 一 个 邻 域内 有 更 优 解 , 走 过 去 

ifm <=mm: 

Start +=mEos 二 

else: 
抬 果 下 一 个 邻 域内 没有 更 优 解 ,以 一 定 的 概率 前 进 或 结束 
clta=m mm /miamm 
棒 机 走动 次 数 越 多 ,对 概率 要 求 越 低 
if delta <=randam() /times: 

Start +=Eos HL 

times + 本 
else: 

rebmm 


性 能 测试 ,比较 两 种 算法 优 劣 ,其 中 的 参数 k 的 值 很 重要 
for j in range (10) : 
win=0 
mpareTimes 31000 
for i in range (ompareTimes) : 
1st =[randint (1,100) for i in range (200)] 
k=3 
jsimmnnealingMax (1st,K) >=hillMex (st,lo : 
win + 习 
if win >=oapareTimes//2: 
Print (win') 
示例 5-38 计算 任意 单调 曲线 在 给 定 区 间 内 的 近似 长 度 。 


dEf curverength (xs, func) : 
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"5:x 轴 的 采样 点 , 越 密 越 准确 

fanc: 曲 线 方 程 对 应 的 函数 '"'' 

括 数 曲线 上 的 采样 点 坐标 (x,y) 

vs Aist (zip Ces,mep (func,x5))) 

版 回 所 有 折线 段 长 度 欧 几 里 得 距离 ) 之 和 

TEbam sm(((v[0] V3 三 机] [0]) * 电 +(V[1] -As 开本 ] [1]) * 昌 ) sag.5 
for iv in emerate (vs[: 1)) 


如 轴 采 样 点 
x5 Jist (mep (lanbbda x:x/100, range (200))) 
釉 线 方程 对 应 的 函数 ,在 x 的 区 间 上 应 单调 
funcs ={ "horizontalLine' :lanbda x: 3, 'diagnalLine':lanbda x: x* 2, 
'QabicArve' :lanbda x: x**} 
釉 线 近似 长 度 
for k,v in fancs.items (0 : 
Erint (k.1just (5) +':',curverength (xs,V)) 


示例 5-39 ”编写 函数 ,模拟 轮 盘 抽奖 游戏 。 

轮 盘 抽奖 是 比较 常见 的 一 种 游戏 ,在 轮 盘 上 有 一 个 指针 和 一 些 不 同 颜 色 ,不同 面积 的 
扇形 ,用力 转动 轮 盘 , 轮 盘 慢 慢 停 下 后 依靠 指针 所 处 的 位 置 来 判定 是 否 中 奖 以 及 奖项 等 
级 。 本 例 中 的 函数 名 和 很 多 变量 名 使 用 了 中 文 , 这 在 Python 3. x 中 是 完全 允许 的 。 


fram Irancom inrport randam 


def 轮 盘 赌 奖项 分 布 ): 
本 次 转盘 读数 =randam() 
for Jov in 奖项 分 布 .items(): 
迁 v[0] <= 本 次 转盘 读数 <v[1]: 
retmk 
格 奖 项 在 轮 盘 上 所 占 比例 
奖项 分 布 ={' 一 等 奖 ': (0,0.08)， 
' 二 等 奖 ': (0.08,0.3)， 
' 三 等 奖 ': (0.3,1.0)} 


中 奖 情况 =dict 0 
for i in range (10000) : 
本 次 战况 - 轮 盘 赌 奖项 分 布 ) 
中 奖 情况 本 次 战况 ] -中 奖 情况 .get 本 次 战况 ,0) 菇 


for item in 中 奖 情况 .items 0 : 
Print (item) 


第 6 章 8 
帮 代码 复 用 技术 (二 ) : 面向 对 象 
‘ 程序 设计 





面向 对 象 程序 设计 (Object Oriented Programming,OOP) 的 思想 主要 针对 大 型 软件 设 
计 而 提出 ,使 得 软件 设计 更 加 灵活 ,能 够 很 好 地 支持 代码 复 用 和 设计 复 用 ,代码 具有 更 好 
的 可 读 性 和 可 扩展 性 ,大 幅度 降低 了 软件 开发 的 难度 。 面 向 对 象 程序 设计 的 一 个 关键 性 
观念 是 将 数据 以 及 对 数据 的 操作 封装 在 一 起 ,组 成 一 个 相互 依存 、 不 可 分 割 的 整体 (对 
象 ) ,不 同 对 象 之 间 通 过 消息 机 制 来 通信 或 者 同步 。 对 于 相同 类 型 的 对 象 ( instance ) 进行 
分 类 .抽象 后 ,得 出 共同 的 特征 而 形成 了 类 (class) ,面向 对 象 程序 设计 的 关键 就 是 如 何 合 
理 地 定义 这 些 类 并 且 组 织 多 个 类 之 间 的 关系 。 

Python 是 面向 对 象 的 解释 型 高 级 动态 编程 语言 ,完全 支持 面向 对 象 的 基本 功能 ,如 封 
装 .继承 .多 态 以 及 对 基 类 方法 的 覆 i 写 。 创 建 类 时 用 变量 形式 表示 对 象 特征 的 成 员 
称 为 数据 成 员 (attribute) ,用 函数 形 寸 象 行为 的 成 员 称 为 成 员 方 法 (method ) ,数据 
成 员 和 成 员 方 法 统称 为 类 的 成 员 。 久 =: 意 的 是 ,Python 中 对 象 的 概念 很 广泛 ,Python 中 
的 一 切 内 容 都 可 以 称 为 对 象 , 函数 也 是 对 象 ,类 也 是 对 象 。 


6.1 类 的 定义 与 使 用 







611 基本 语法 


Python 使 用 class 关键 字 来 定义 类 ,class 关键 字 之 后 是 一 个 空格 , 接 下 来 是 类 的 名 字 ， 
如 果 派 生 自 其 他 基 类 的 话 则 需要 把 所 有 基 类 放 到 一 对 括号 中 并 使 用 逗号 分 隔 , 然 后 是 一 
个 冒号 ,最 后 换行 并 定义 类 的 内 部 实现 。 类 名 的 首 字母 一 般 要 大 写 ,当然 也 可 以 按照 自己 
的 习惯 定义 类 名 ,但 是 一 般 推荐 参考 惯例 来 命名 ,并 在 整个 系统 的 设计 和 实现 中 保持 风格 
一 致 ,这 一 点 对 于 团队 合作 非常 重要 。 

class Car (dbject) : 证 义 一 个 类 ,派生 和 白 coject 类 

Ef infor (self) : 证 义 成 员 方 法 
Print (“Ihis is a car) 

定义 了 类 之 后 ,就 可 以 用 来 实例 化 对 象 ,并 通过 “对 象 名 . 成员" 的 方式 来 访问 其 中 的 
数据 成 员 或 成 员 方 法 。 

>>>car Car() 疣 例 化 对 象 
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>>>car.infor() 蔽 用 对 象 的 成 员 方法 

This is a car 

在 Python 中 ,可 以 使 用 内 置 函 数 isinstance( ) 来 测试 一 个 对 象 是 否 为 某 个 类 的 实例 ， 
或 者 使 用 内 置 函 数 type( ) 查 看 对 象 类 型 。 


>>>isinstance (car, Car) 
True 

>>>isinstance (car, str) 
False 


>>>type (car) 
<class' min .Car'> 
Python 提供 了 一 个 关键 字 pass ,执行 的 时 候 什么 也 不 会 发 生 , 可 以 用 在 类 和 函数 的 定 
义 中 或 者 选择 结构 中 ,表示 空 语句 。 如 果 和 暂时 没有 确定 如 何 实 现 某 个 功能 ,或 者 提前 为 以 
后 的 软件 升级 预 留 一 点 空间 ,可 以 使 用 关键 字 pass 来 " 占 位 ”。 
和 定义 函数 一 样 ,在 定义 类 时 ,也 可 以 使 用 三 引号 为 类 进行 必要 的 注释 。 
>>>Class Test: 
Whis is nly a test."'' 
Fass 


>>>Test. dpc _ 得 看 类 的 帮助 文档 
"his is cnly a test.y 


612 type 类 


在 Python 中 ,type 是 一 个 特殊 的 类 ,可 以 看 作 是 所 有 类 型 (包括 object) 的 基 类 。 另 
外 ,Python 对 象 都 有 一 个 成 员 __class_ 可 以 查看 其 所 属 的 类 ,与 内 置 函 数 type( ) 的 返回 结 
果 一 致 ;所 有 Python 类 都 有 一 个 成 员 __bases__, 返 回 包含 该 类 所 有 基 类 的 元 组 ;Python 类 
的 另 一 个 成 员 __subclasses_() 可 以 返回 该 类 型 的 所 有 子 类 。 


>>>car. _class _ #ar 是 6.1.1 节 中 类 car 的 实例 
<class' rnain _.Car'> 

>>>car. class _. Class _ 相 定 义 类 型 的 基 类 是 type 
<class 'type' > 

>>>x 


>>>x. class _. class _ 整 型 int 的 基 类 也 是 type 
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>>>x. class _. _class #ject 的 基 类 也 是 type 


<class 'type' > 
>>>Gef 工 () : 

Fass 
>>>f- class _ 得 看 对 象 所 属 类 型 
<class 'finctian' > 
>>>type (日 
<class 'finctian' > 
>>>''. _Class_ 
<class 'str' > 
>>>(0。 _class _ 
<class 'bple' > 
>>>[]。 _class 


<class 'list' > 


>>>{}.__Class _. bases _[0]. _sibclasses _() 
得 看 所 有 子 类 
位 里 略 去 了 输出 结果 
>>>abject. _ sibclasses _() [0] 
<class 'str iterator' > 
古 面 的 代码 可 以 退出 Pythcn 环境 ,结束 程序 
>>>[c for c jin ().。 Class . bases _[0]. _sibclasses _() 


ifc. nme _=='Qitter'][0] 0,0) 0 


613 定义 带 修 饰 器 的 类 


与 函数 一 样 ,定义 类 时 也 可 以 使 用 修饰 器 。 假 设 用 户 创 建文 件 .修改 文件 .删除 文件 、 
查看 文件 列表 等 操作 都 需要 先 登 录 系统 才 行 ,每 个 操作 之 前 都 需要 确定 用 户 是 否 已 经 成 
功 登 录 , 可 以 使 用 Python 扩展 库 state 中 的 修饰 器 stateful 来 实现 。 使 用 pip 安装 扩展 库 
state , 如果 下 面 的 代码 不 能 运行 的 话 , 需 要 修改 state 安装 文件 夹 里 的 __init__. py 文件 ,把 
第 16 行 的 “for i in cls. __dict__. itervalues( ) :" 改 为 "for i in cls. __dict__. values():”, 把 
第 39 行 的 “except AttributeError，e:" 改 为 “except AttributeError as e:” ,把 第 44 行 和 第 46 
行 的 raise e" 都 改 为 raise。 


:import state 
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Print ("suooessfiully logged in.') 
瘦 果 成 功 登 录 就 切换 至 工作 状态 
state.switch (self, User.signedm) 


class signedm (state.state) : 
@ state.behavior 
aef createFile (self) : 
with apen (test.bt 'w') as fp: 
fp-write (created 


@ state.behavior 
Cef rodifyrile (salf): 
if not os .path.exists ('test.txt'"): 
rebm 
With qpen('test.txt', 'a+') as fp: 
fp.write('ok') 


@ state.behavior 
GEf celeteFile (self) : 
if os.path.exists ('test.txt'): 
c5.Iemcve('test. 世 十") 


@ state.bshavior 
Gef listFile (self) : 
for f in os.listdir('."): 
Print (D) 


zhang =User () 

zhang.signm ("admin', 'admin') 
zhang. listrile() 
zhang.createFile() 
zhang-nodifyFile () 
zhang-listPile(0 
zhang.deleterile () 
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6.2 数据 成 员 与 成 员 方 法 
621 私有 成 员 与 公有 成 员 


私有 成 员 在 类 的 外 部 不 能 直接 访问 ,一 般 是 在 类 的 内 部 进行 访问 和 操作 ,或 者 在 类 的 
外 部 通过 调用 对 象 的 公有 成 员 方 法 来 访问 ,而 公有 成 员 是 可 以 公开 使 用 的 , 既 可 以 在 类 的 
内 部 进行 访问 ,也 可 以 在 外 部 程序 中 使 用 。 

从 形式 上 看 ,在 定义 类 的 成 员 时 ,如果 成 员 名 以 两 个 (或 更 多 ) 下 画 线 开头 但 是 不 以 
两 个 或 更 多 下 画 线 结束 则 表示 是 私有 成 员 ,否则 就 不 是 私有 成 员 。Python 并 没有 对 私有 
成 员 提供 严格 的 访问 保护 机 制 , 通 过 一 种 特殊 方式 “对 象 名 . _ 类 名 __xxx" 也 可 以 在 外 部 
程序 中 访问 私有 成 员 ,但 这 会 破坏 类 的 封装 性 ,不 建议 这 样 做 。 


>>>Class A: 
Gef__init _(self,valuel =-0,value? =0): 构造 方法 
self。valuel aluel 
Self. _velue2 alue2 种 有 成 员 
def setvalue (self,valuel ,value?) : 碱 员 方法 ,公有 成 员 
self. valuel aluel 
Self. _value? walue2 人 在 类 内 部 可 以 直接 访问 私有 成 员 
GEf show (self) : 戌 员 方 法 ,公有 成 员 


>>>a (0) 

>>>a._ valuel 寿 类 外 部 可 以 直接 访问 非 私 有 成 员 
0 

>>>a. A _value2 三 外 部 访问 对 象 的 私有 数据 成 员 


从 严格 意义 上 来 讲 ,这 与 Python 的 名 称 绑 定 机 制 有 关系 ,在 类 中 以 两 个 或 更 多 下 画 
线 开 头 但 不 以 两 个 或 更 多 下 画 线 结束 的 成 员 绑 定 到 对 象 时 ,都 会 绑 定 为 “对 象 名 . _ 类 名 
”成员 名 ”类似 的 形式 ,除非 类 名 中 只 包含 下 画 线 。 
>>>Class DerD: 
aef init (selfw: 


salf. velue=r 
>>>d=Demp G) 
>>>d。 Dap value 炉 问 形式 被 转换 
EE 
>>>class 
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>>>d= _65) 
> _vane 环 转 换 访问 形式 


一 个 圆 点 “. "是 成 员 访 问 运 算 符 , 可 以 用 来 访问 命名 空间 .模块 或 对 象 中 的 成 员 ,在 
IDLE .Eclipse + PyDev .WingIDE .PyCharm 或 其 他 Python 开发 环境 中 ,在 对 象 或 类 名 后 面 
加 上 一 个 圆 点 ". ”, 都 会 自动 列 出 其 所 有 公开 成 员 ,如 图 6-1 所 示 。 而 如 果 在 圆 点 ". ”后 
面 再 加 一 个 下 画 线 , 则 会 列 出 该 对 象 或 类 的 所 有 成 员 , 包 括 私 有 成 员 , 如 图 6-2 所 示 。 当 
然 ,也 可 以 使 用 内 置 函 数 dir( ) 来 查看 指定 对 象 .模块 或 命名 空间 的 所 有 成 员 。 











图 6-1 列 出 对 象 公开 成 员 图 6-2 ” 列 出 对 象 所 有 成 员 


在 Python 中 ,以 下 画 线 开头 或 结束 的 成 员 名 有 特殊 的 含义 ,在 类 的 定义 中 用 下 画 线 
作为 成 员 名 前 级 和 后 缀 往往 是 表示 类 的 特殊 成 员 。 

(1) _xxx: 以 一 个 下 画 线 开头 ,保护 成 员 , 只 有 类 对 象 和 子 类 对 象 可 以 访问 这 些 成 
员 ,在 类 的 外 部 一 般 不 建议 直接 访问 ;在 模块 中 使 用 一 个 或 多 个 下 画 线 开头 的 成 员 不 能 用 
from module import * 导入 ,除非 在 模块 中 使 用 __all__ 变量 明确 指明 这 样 的 成 员 可 以 被 

(2) _xxx_: 前 后 各 两 个 下 画 线 ,系统 定义 的 特殊 成 员 。 

(3) _xxx: 以 两 个 或 更 多 下 画 线 开头 但 不 以 两 个 或 更 多 下 画 线 结束 ,表示 私有 成 
员 ,一 般 只 有 类 对 象 自己 能 访问 , 子 类 对 象 也 不 能 访问 该 成 员 ,但 在 对 象 外 部 可 以 通过 
“对 象 名 . _ 类 名 _xxx" 这 样 的 特殊 方式 来 访问 。 


622 数据 成 员 


数据 成 员 可 以 大 致 分 为 两 类 : 属于 对 象 的 数据 成 员 和 属于 类 的 数据 成 员 。 属 于 对 象 
的 数据 成 员 一 般 在 构造 方法 _init_( ) 中 定义 ,当然 也 可 以 在 其 他 成 员 方法 中 定义 ,在 定 
义 和 在 实例 方法 中 访问 数据 成 员 时 以 self 作为 前 缀 ,同一 个 类 的 不 同 对 象 (实例 ) 的 数据 
成 员 之 间 互 不 影响 ;属于 类 的 数据 成 员 是 该 类 所 有 对 象 共享 的 ,不 属于 任何 一 个 对 象 ,在 
定义 类 时 这 类 数据 成 员 一 般 不 在 任何 一 个 成 员 方法 的 定义 中 。 在 主 程序 中 或 类 的 外 部 ， 
对 象 数 据 成 员 属 于 实例 (对 象 ) ,只 能 通过 对 象 名 访问 ;而 类 数据 成 员 属 于 类 ,可 以 通过 类 
名 或 对 象 名 访问 。 

利用 类 数据 成 员 的 共享 性 ,可 以 实时 获得 该 类 的 对 象 数量 ,并 且 可 以 控制 该 类 可 以 创 
建 的 对 象 最 大 数量 。 例 如 : 
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>>>class Der (abject) : 


total -0 
GEE new (cls, sargs, *kwargs): 静 方 法 在 ”init _() 之 前 被 调用 
if cls.total >3: 最 多 人 允许 创建 3 个 对 象 
Iaise Perepticn(" 最 多 只 能 创建 3 个 对 象 ) 
else: 


retum doject. _new _ (cls) 
aef init _ (self): 
Demp.tctal =pam.total 机 
>>>t1 Paw!() 
>>> 
<__min _.Darw cbject at 0x0000000003470278 > 
>>>t2 Damw() 
>>>t3 =Demp() 
>>>t4 =Derp () 
Exosption: 最 多 只 能 创建 3 个 对 象 
>>>t4 
NEmeError: nare '"t4' is not defined 


623 成员 方法 、 类 方法 静态 方法 、 抽 象 方法 


首先 应 该 明确 ,在 面向 对 象 程序 设计 中 ,函数 和 方法 这 两 个 概念 是 有 本 质 区 别 的 。 方 
法 一 般 指 与 特定 实例 绑 定 的 函数 ,通过 对 象 调用 方法 时 ,对 象 本 身 将 被 作为 第 一 个 参数 自 
动 传递 过 去 ,普通 函数 并 不 具备 这 个 特点 。 例 如 ,内 置 函 数 sorted( ) 必须 要 指明 要 排序 的 
对 象 ,而 列表 对 象 的 sort( ) 方 法 则 不 需要 ,默认 是 对 当前 列表 进行 排序 。 


>>>class Daro: 


>>>t.test =test 盎 态 增加 普通 函数 
>>>t.test 

<functicn test zt 0x00000000034B7E2D > 

>>>t.test (t,3) 需要 为 self 传 递 参 数 
>>>print (t.valve) 

3 

>>>inport types 

>>>t.test types .Mthodrype (test,t) 动态 增加 绑 定 的 方法 
>>>t.test 

<bound method test of < main _.Dam cbject at 0x000000000074F9E8 >> 

>>>t.test 6) 环 需 要 为 self 传 递 参数 
>>>print (t.value) 

时 
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Python 类 的 成 员 方 法 大 致 可 以 分 为 公有 方法 .私有 方法 .静态 方法 .类 方法 和 抽象 方 
法 这 几 种 类 型 。 公 有 方法 、 私 有 方法 和 抽象 方法 一 般 是 指 属 于 对 象 的 实例 方法 ,私有 方法 
的 名 字 以 两 个 或 更 多 个 下 画 线 开始 ,而 抽象 方法 一 般 定 义 在 抽象 类 中 并 且 要 求 派生 类 必 
须 重 新 实现 。 每 个 对 象 都 有 自己 的 公有 方法 和 私有 方法 ,在 这 两 类 方法 中 都 可 以 访问 属 
于 类 和 对 象 的 成 员 。 公 有 方法 通过 对 象 名 直接 调用 ,私有 方法 不 能 通过 对 象 名 直接 调用 ， 
只 能 在 其 他 实例 方法 中 通过 前 级 self 进行 调用 或 在 外 部 通过 特殊 的 形式 来 调用 。 另 外 ， 
Python 中 的 类 还 支持 大 量 的 特殊 方法 ,这 些 方法 的 两 侧 各 有 两 个 下 画 线 (__) ,往往 与 某 
个 运算 符 或 内 置 函 数 相对 应 。 
所 有 实例 方法 (包括 公有 方法 .私有 方法 .抽象 方法 和 某 些 特殊 方法 ) 都 必须 至 少 有 
一 个 名 为 self 的 参数 ,并 且 必须 是 方法 的 第 一 个 形 参 (如 果 有 多 个 形 参 的 话 ) ,self 参数 代 
表 当 前 对 象 。 在 实例 方法 中 访问 实例 成 员 时 需要 以 self 为 前 级 ,但 在 外 部 通过 对 象 名 调 
用 对 象 方法 时 并 不 需要 传递 这 个 参数 。 如 果 在 外 部 通过 类 名 调用 属于 对 象 的 公有 方法 ， 
需要 显 式 为 该 方法 的 self 参数 传递 一 个 对 象 名 ,用 来 明确 指定 访问 哪个 对 象 的 成 员 。 
静态 方法 和 类 方法 都 可 以 通过 类 名 和 对 象 名 调用 ,但 不 能 直接 访问 属于 对 象 的 成 员 ， 
只 能 访问 属于 类 的 成 员 。 另 外 ,静态 方法 和 类 方法 不 属于 任何 实例 ,不 会 绑 定 到 任何 实 
例 ,当然 也 不 依赖 于 任何 实例 的 状态 ,与 实例 方法 相 比 能 够 减少 很 多 开销 。 类 方法 一 般 以 
cls 作为 第 一 个 参数 表示 该 类 自身 ,在 调用 类 方法 时 不 需要 为 该 参数 传递 值 ,静态 方法 则 
可 以 不 接收 任何 参数 。 
>>>Class Foct: 
total -0 
of init (self,y): 
salf. value=— 
Root。 _total + 习 


构造 方法 ,特殊 方法 


锅 通 实例 方法 ,一 般 以 salf 作 为 第 一 个 参数 的 名 字 


月 饰 器 ,声明 类 方法 
由 方法 ,一 般 以 as 作为 第 一 个 参数 的 名 字 


@ statiarethod 艇 饰 器 ,声明 静态 方法 
ef staticshowrotal () 头 态 方法 ,可 以 没有 参数 
print (ot. _total) 
>>>r Foot BG) 
>>>r.classshowTotal () 旦 过 对 象 来 调用 类 方法 
1 
>>>r-staticshowrotal () 时 过 对 象 来 调用 静态 方法 
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K 
>>>Foot.classshowrotal () 旦 过 类 名 调用 类 方法 
>>>Foot.staticshowrotal () 旦 过 类 名 调用 静态 方法 
>>>Foct-show() 坛 图 通过 类 名 直接 调用 实例 方法 ,失败 
TYPsError: uribound method show () must be called with Foot instance as first argment (got nothing 
instead) 
>>>Foot.show(r) 天 以 通过 这 种 方法 来 调用 方法 并 访问 实例 成 员 


self. value:3 

Foot. _total: 2 

抽象 方法 一 般 在 抽象 类 中 定义 ,并 且 要 求 在 派生 类 中 必须 重新 实现 ,否则 不 允许 派生 
类 创建 实例 。 


inport abc 
Class Fo (retaclass =eibc.RECOMEta) : 机 象 类 
cef £1 (self) : 融通 实例 方法 
print 423) 
cef 2 (salf): 融通 实例 方法 
Print (456) 
@ abc.abstractmethod 机 象 方法 
Gef BB (self): 
raise Exoeptian (You mst Teirplerent this method.') 
class Bar (FbO) : 
Gef B3 (self): 伺 须 重新 实现 基 类 中 的 抽象 方法 
Print (33333) 
b=Bar() 
b.B0 
624 属性 


公开 的 数据 成 员 可 以 在 外 部 随意 访问 和 修改 ,很 难保 证 用 户 进行 修改 时 提供 新 数据 
的 合法 性 ,数据 很 容易 被 破坏 ,也 不 符合 类 的 封装 性 要 求 。 解 决 这 一 问题 的 常用 方法 是 定 
义 私 有 数据 成 员 ,然后 设计 公开 的 成 员 方法 来 提供 对 私有 数据 成 员 的 读 取 和 修改 操作 , 修 
改 私有 数据 成 员 之 前 可 以 对 值 进行 合法 性 检查 .提高 了 程序 的 健壮 性 ,保证 了 数据 的 完整 
性 。 属 性 是 一 种 特殊 形式 的 成 员 方 法 ,结合 了 公开 数据 成 员 和 成 员 方 法 的 优点 , 既 可 以 像 
成 员 方 法 那样 对 值 进 行 必 要 的 检查 ,又 可 以 像 数据 成 员 一 样 灵活 地 访问 。 

在 Python 3.x 中 ,属性 得 到 了 较为 完整 的 实现 ,支持 更 加 全 面 的 保护 机 制 。 如 果 设 置 
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属性 为 只 读 , 则 无 法 修改 其 值 ,也 无 法 为 对 象 增加 与 属性 同名 的 新 成 员 , 当然 也 无 法 删除 
对 象 属性 。 例 如 : 


>>>class Test: 
cf init _ (self,value): 


salf. _value walue 币 有 数据 成 员 
@property 月 饰 器 ,定义 属性 ,提供 对 私有 数据 成 员 的 访问 
Gef value (self) : 可 读 属性 ,无 法 修改 和 删除 

reum salf. valie 

>>>t =Test (3) 

>>>t.value 
3 

>>>t.value 起 哥 读 属性 不 允许 修改 值 
Attributeprror: can't set attribute 

>>>cel t.value 虐 图 删除 对 象 属性 ,失败 
Attriputegrror: can't delete attripute 

>>>t.value 


下 面 的 代码 则 把 属性 设置 为 可 读 、 可 修改 ,而 不 允许 删除 。 


>>>Class Test: 
def__init _ (self,vale): 
self.  _value walue 


CEf_ _get (self): 赎 取 私有 数据 成 员 的 值 
retum self. value 
cef _ _set (self,V): 月 改 私 有 数据 成 员 的 值 
Salf. value= 
Value Property( _get,__set) 何 读 可 写 属 性 ,指定 相应 的 读 写 方法 
GEf show (self): 
Print (self. _value) 
>>>t =Test 3) 
>>>t.vale 克 许 读 取 属 性 值 
3 
>>>t.vale 5 网 许 修改 属 性 值 
>>>.Value 


要 
>>>t.show() 


5 
>>>cel t.value 赋 图 删除 属性 ,失败 


里 性 对 应 的 私有 变量 也 得 到 了 相应 的 修改 
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triputeprror: can't Gelete attribute 
也 可 以 将 属性 设置 为 可 读 、 可 修改 .可 删除 。 


>>>class Test: 
cf init (elfrvelue): 
salf. velue ae 


GEf get(self): 
Tetbmm self. vale 


Cef __set(self,v): 
self. valle=— 


cEf __del (salf): 制 除 对 象 的 私有 数据 成 员 
cel self._velue 


Value property( _get，_set， _Gel) 帅 读 、 可 写 .可 删除 的 属性 


GEf show(self): 
print (self。 _ value) 
>>>t =Test G3) 
>>>t.show() 
3 
>>>t.value 
3 
>>>t.value 起 
>>>t.show() 
5 
>> 半 .Value 
5 
>>>Gel 七 .Value 


>>>t.value 得 应 的 私有 数据 成 员 已 删除 ,访问 失败 
Attriputerrror: "Test' cbject has np attribute ' Test _value' 

>>>t.show() 
Attriputerrror: "Test' cbject has np attribute ' Test _value' 

>>>t.value 导 甚 态 增 加 属性 和 对 应 的 私有 数据 成 员 
>>>t.show() 

了 

>>>t.value 


下 


625 类 与 对 象 的 动态 性 、 混 入 机 制 
在 Python 中 可 以 动态 地 为 自 定义 类 和 对 和 象 增加 数据 成 员 和 成 员 方 法 ,这 也 是 Python 
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动态 类 型 的 一 种 重要 体现 。 在 6.2.3 节 已 经 见 过 相关 的 用 法 ,下 面 再 详细 介绍 一 下 。 

jimport types 
class Car (dbject) : 

price 400000 盘 于 类 的 数据 成 员 

cef __init _ (salf,o): 

salf.color—e 三 于 对 象 的 数据 成 员 

Carl =Car ("Fed") 儿 例 化 对 象 
Print (carl .color, Car.prioe) 炉 问 对 象 和 类 的 数据 成 员 
Car.price 10000 米 改 类 属性 
Car.name ='gp' 盎 态 增加 类 属性 
Carl .color ="Yellow" 米 改 实例 属性 
Print (carl .color, Car.price, Car.nane) 
Gef setSpeed (self, 5): 

Self.speed=5 
Carl .setSpeed types .MethodType (setSpeed, carl) 盎 态 为 对 象 增加 成 员 方 法 
carl .setspeeq (50) 姻 用 对 象 的 成 员 方 法 
Print (carl .speed) 


Python 类 型 的 动态 性 使 得 我 们 可 以 动态 为 自 定义 类 及 其 对 象 增加 新 的 属性 和 行为 ， 
俗称 混入 (mixin) 机 制 , 这 在 大 型 项 目 开 发 中 会 非常 方便 和 实用 。 例 如 ,系统 中 的 所 有 用 
户 分 类 非常 复杂 ,不 同 用 户 组 具有 不 同 的 行为 和 权限 ,并 且 可 能 会 经 常 改变 。 这 时 候 可 以 
独立 地 定义 一 些 行为 ,然后 根据 需要 来 为 不 同 的 用 户 设置 相应 的 行为 能 力 。 在 动画 设计 
中 也 有 类 似 的 技术 ,例如 ,可 以 设计 一 些 动 作 , 然 后 根据 需要 把 这 些 动 作 附加 到 相应 的 角 
色 上 。 

>>>inport types 

>>>class Persan (doject) : 

def__init _ (salf,nare): 
assert jsinstance (nane, str), "name mst be string" 
Self.nare mae 


>>>Gef sing(self): 
Print (self.name +' can sing.') 


>>>Gef walk (self) : 
Print (self.name +' can walk.') 


>>>Gef eat (self) : 
Print (salf.name +' can eat.") 


>>>zharg =Persan ('zhang') 
>>>zhang.sing() 其 户 不 具有 该 行为 
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Dttriputerrror: ‘Persan' doject has np attripute 'sing" 
>>>zhang.sing types .Msthodrype (sing, zhang) 动态 增加 一 个 新 行为 
>>>zhang.sing() 
zhang can sing. 
>>>zhang.walk() 
Attributegrror: 'Persan" aoject has mo attributbe ‘walk’ 
>>>zhang .walk types .Methodrype (walk, zhang) 
>>>zhang.walk() 
zharg can walk. 
>>>Gel zhang.walk 删除 用 户 行 为 
>>>zhang.walk() 
Attriputegrror: 'Eerscn' cbject has np attribute walk' 


6.3 继承 、 多 态 .依赖 注入 
继承 


设计 一 个 新 类 时 ,如 果 可 以 继承 一 个 已 有 的 设计 良好 的 类 然后 进行 二 次 开发 ,可 以 大 


幅度 减少 开发 工作 量 , 并 且 可 以 很 大 程度 地 保证 质量 。 在 继承 关系 中 ,已 有 的 \ 设 计 好 的 
类 称 为 父 类 或 基 类 ,新 设计 的 类 称 为 子 类 或 派生 类 。 派 生 类 可 以 继承 父 类 的 公有 成 员 ,但 
是 不 能 继承 其 私有 成 员 。 如 果 需 要 在 派生 类 中 调用 基 类 的 方法 ,可 以 使 用 内 置 函数 super 
() 或 者 通过 “ 基 类 名 .方法 名 ( )" 的 方式 来 实现 这 一 目的 。 


Teacher 类 的 对 象 。 


示例 6-1 设计 Person 类 ,并 根据 Person 派生 Teacher 类 ,分 别 创建 Person 类 与 


俯 类 必须 继承 于 doject, 否 则 在 派生 类 中 将 无 法 使 用 super 0 函数 
Class Ferscn (doject) : 


Gf__init _ (self,name='',age =20,sex="men'): 
旺 过 调用 方法 进行 初始 化 ,这 样 可 以 对 参数 进行 更 好 地 控制 


def setzoP (self, ac) : 
if type (age) ! =int: 
raise Eeeptian ("age mst be an integer.') 
salf. _ap ep 
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GEE setsex (Self, sa) : 
让 sex nct in (en' waren'): 
raise Exception ('sex mst be "man" or "waren"™') 
Self. _ sex=sex 


CEf show (self): 
Print(self. name,self. age,salf. _sex,sep="'\n') 


路 生 类 
Class Teacher (Ferscn) : 
df__init _(self,name='',age =30,sex="men',department ='Omputer'): 

椅 用 基 类 构造 方法 初始 化 基 类 的 私有 数据 成 员 
Sper (Teaher,self)._ _init _ (nane,age,sex) 
她 可 以 这 样 初始 化 基 类 的 私有 数据 成 员 
fersm. _init _ (self,nane,age,sex) 
制 始 化 派生 类 的 数据 成 员 
self.setDepartment (department) 


Gef setDepartment (self, departrrent) : 
if type (Gepartment) ! =str: 
raise Eoeptian ('department must be a string.') 
self. cepartrent -epartrent 


GEf shcow(self) : 
Siper (Teacher, self) .show() 
Print (self.  _department) 


if_ nme _==' main _': 
创建 基 类 对 和 象 
zhangsan =Persan('Zhang San'v19, man') 
zhangsan. show () 
Print (' =" * 30) 


创建 派生 类 对 象 
lisi =Teacher (Ti si',32, men', Math') 
lisi.show() 
映 用 继承 的 方法 修改 年 龄 
lisi .setage (40) 
lisi.show() 
Python 支持 多 继承 ,如 果 父 类 中 有 相同 的 方法 名 ,而 在 子 类 中 使 用 时 没有 指定 父 类 
名 , 则 Python 解释 器 将 从 左 向 右 按 顺 序 进行 搜索 ,使 用 第 一 个 匹配 的 成 员 。 
下 面 的 代码 完整 地 描述 了 类 的 继承 机 制 ,请 认真 体会 构造 方法 .私有 方法 以 及 普通 公 
开 方 法 的 继承 原理 。 
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>>>class A(): 
aef init _ (self): 
salf. _ private() 
self.pilic() 


def__private(self): 
Print(' _ private() method of A') 


cef pblic (self) : 
Print ('piblic() method of A') 


def__test (self): 
Print(' _test() method of A') 
>>>class BO): 
def __ private(self): 
print(' _ private() method of B') 


aef piblic (self) : 
Print (‘piblic() method of B') 
>>>PB0) 
__ Private() method of A 
piblic() method of B 
>>>p. B_ _test() 
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广 意 ,B 类 没有 构造 方法 


创建 派生 类 对 象 


九 生 类 没有 继承 基 类 中 的 私有 成 员 方 法 


三 tribputsprror: 'B' doject has np attribute ' BE _test' 


>>>b. A__test() 
_ _test () method of A 
>>>b. A__ private() 
__ Private() method of A 
>>>class CW: 
cef _init _ (self): 
self. _ private() 
self.piblic() 


GEf __private(salf): 
print(' _ private() msthod of C') 


def Puiblic (self) : 
print (piblic() method of Cc') 

>>>c C0 

_ _ Frivate() method of C 

piblic() method of C 


632 多 态 


时 过 特殊 方法 可 以 访问 基 类 中 的 私有 成 员 方 法 


役 有 严格 意义 的 私有 成 员 


广 意 ,C 类 有 构造 方法 


多 态 (polymorphism) 是 指 基 类 的 同一 个 方法 在 不 同 派生 类 对 象 中 具有 不 同 的 表现 和 
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行为 。 派 生 类 继承 了 基 类 的 行为 和 属性 之 后 ,还 会 增加 某 些 特定 的 行为 和 属性 ,同时 还 可 
能 会 对 继承 来 的 某 些 行为 进行 一 定 的 改变 ,这 都 是 多 态 的 表现 形式 , 正 所 谓 龙 生 九 子 , 子 
子 皆 不 同 。 通 过 第 2 章 的 学 习 大 家 已 经 知道 ,Python 大 多 数 运算 符 可 以 作用 于 多 种 不 同 
类 型 的 操作 数 , 并 且 对 于 不 同类 型 的 操作 数 往 往 有 不 同 的 表现 ,这 本 身 就 是 多 态 , 是 通过 
特殊 方法 与 运算 符 重 载 实现 的 ,将 在 6.4 节 进 行 详细 介绍 。 下 面 的 代码 主要 演示 通过 在 
派生 类 中 重 写 基 类 方法 实现 多 态 。 
>>>class mmnirel (Gbject) : 证 义 基 类 
GEf show(self): 
Print ('T am an animrel.7) 
>>>class Cat Animal) : 证 生 类 ,覆盖 了 基 类 的 show0 方 法 
GEf show(self): 
Print('I ama cat.') 
>>>class Dog Mniral) : 凰 生 类 
GEf show(self): 
Print('I ama dog.') 
>>>class Tiger nimal) : 证 生 类 
GEf show(self): 
Print('I ama tiger.') 
>>>class Test (Anirmal) : 记 生 类 ,没有 和 获 盖 基 类 的 show0 方 法 
Fass 
>>>x =[item() for item in (imal,Cat,Dog, Tiger, Test)] 
>>>for item in x: 婉 历 基 类 和 派生 类 对 象 并 调用 show0 方 法 
item.show() 
Iaman anirel . 
Iamacat. 
Iamadg. 
I ama tiger. 
Iaman anirel . 


633 依赖 注入 技术 的 不 同 实现 方法 


依赖 注入 ( Dependency Injection) 又 称 为 控制 反 转 (Inversion of Control) ,主要 用 来 实 
现 不 同 模块 或 类 之 间 的 解 看 ,可 以 根据 需要 动态 地 把 某 种 依赖 关系 注入 到 对 象 中 ,使 得 模 
块 的 设计 更 加 独立 。 同 时 ,依赖 注入 也 是 多 态 的 一 种 实现 方式 。 常 用 的 依赖 注入 途径 有 
接口 注入 、Set 注入 和 构造 注入 3 种 。 另 外 ,反射 也 属于 比较 常用 的 依赖 注入 技术 ,可 以 根 
据 给 定 的 不 同 信 息 创建 不 同类 型 的 对 象 。 本 节 就 分 别 介绍 一 下 这 几 种 依赖 注入 的 技术 。 


1. 接口 注入 


首先 定义 一 个 接口 类 ,然后 在 继承 了 该 接口 的 类 中 实现 特定 的 接口 方法 ,而 在 接口 方 
法 中 根据 传人 参数 的 不 同 做 出 不 同 的 行为 。 





t=Test () 
t.injectian A()) 
t.show() 


t.injectian 8()) 
t.show() 


上 面 代码 的 运行 结果 为 
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琅 口 


内 承接 口 
羔 现 接口 方法 


痪 通 方法 


由 A 和 BB 是 测试 用 的 


著 入 不 同类 型 的 对 象 


<__min _.A doject at 0x00000000033F6B70> 


<__min _.B cbject at 0x000000000339B470 > 


2. Set 注入 


这 种 注入 方式 是 通过 类 本 身 提供 的 一 个 方法 用 来 注入 不 同类 型 的 对 象 来 设置 自身 对 


象 和 其 他 对 象 的 依赖 关系 。 


Class Test: 
GEf setcbject (self,testcbject) : 
Self.doject =testcoject 


GEf show (self) : 
Print (self.cbject) 


条 实现 依赖 注入 
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t=Test () 
t.setopject AO) 苇 入 不 同类 型 的 对 象 
t.show() 


七 .sstcoject (B()) 
七 -show() 


3. 构造 注入 
这 种 注入 方式 是 通过 在 创建 类 的 实例 时 为 构造 方法 传人 不 同类 型 的 对 象 实现 的 。 


Class Test: 
Gef __init (selfvtestcoject) : 旦 过 构造 方法 实现 依赖 注入 
GEf show (self) : 
Print (self.abject) 


Class A: 


Fass 


tl Test AO)) 欧 构 造 方法 传人 不 同类 型 的 对 象 
蕊 .show( 

t2 Test B()) 

t2.show() 


4. 反射 


通过 反射 技术 可 以 根据 传人 信息 (例如 类 的 名 字 ) 的 不 同 来 创建 不 同类 型 的 对 象 ,从 
而 实现 多 态 和 依赖 注入 。 


class mnimal : 证 义 一 个 类 
Gf__init _ (self,name) : 
Self.name are 


class Ferscn Mniral) : 负 承 animal 类 ,也 可 以 是 一 个 普通 的 新 类 


a=glchals(0 [animal'] (‘dbg') 薪 单 形式 的 反射 
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-Show() 

P=glcbals0 ['Persan'] ("zhangsan7) 得 据 类 的 名 字 不 同 来 创建 不 同 的 对 象 
P-show( 

下 面 的 代码 演示 了 反射 的 另 一 种 方式 : 

class Miral: 证 义 一 个 类 


Gf __init _ (selfname): 
Self.nere are 


class Ferscn nimal) : 秋 承 aninal 类 ,也 可 以 是 一 个 普通 的 新 类 


a=createcbject Aniral, ‘cog') 和 | 建 不 同类 型 的 对 象 


6.4 特殊 方法 与 运算 符 重 载 


Python 类 有 大 量 的 特殊 方法 ,其 中 比较 常见 的 是 构造 方法 和 析 构 方法 。Python 中 类 
的 构造 方法 是 _init_() ,用 来 为 数据 成 员 设 置 初始 值 或 进行 其 他 必要 的 初始 化 工作 ,在 
实例 化 对 象 时 被 自动 调用 和 执行 。 如 果 用 户 没有 设计 构造 方法 .Python 会 提供 一 个 默认 
的 构造 方法 用 来 进行 必要 的 初始 化 工作 。Python 中 类 的 析 构 方法 是 _del__() ,一 般 用 
来 释放 对 象 占 用 的 资源 ,在 Python 删除 对 象 和 收回 对 象 空间 时 被 自动 调用 和 执行 。 如 
果 用 户 没 有 编写 析 构 方法 ,Python 将 提供 一 个 默认 的 析 构 方法 进行 必要 的 清理 工作 。 

在 Python 中 ,除了 构造 方法 和 析 构 方法 之 外 ,还 有 大 量 的 特殊 方法 支持 更 多 的 功能 ， 
例如 ,运算 符 重 载 就 是 通过 在 类 中 重 写 特殊 方法 实现 的 。 在 自 定义 类 时 如 果 重 写 了 某 个 
特殊 方法 即 可 支持 对 应 的 运算 符 或 内 置 函 数 ,具体 实现 什么 工作 则 完全 可 以 由 程序 员 根 
据 实际 需要 来 定义 。 表 6-1 列 出 了 其 中 一 部 分 比较 常用 的 特殊 成 员 ,完整 列表 请 参考 下 
面 的 网 址 : 

https://docs.pythan.org/3/reference/datarodel .htmljbpecial -method nenes 

表 6-1 Python 类 的 特殊 成 员 
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方 法 功能 说 明 
new_() 类 的 静态 方法 ,用 于 确定 是 否 要 创建 对 象 
init _() 构造 方法 ,创建 对 象 时 自动 调用 
—del_() 析 构 方法 ,释放 对 象 时 自动 调用 
_add_() 十 
_sub_() 一 
_mul_() 过 
tmediv_() 次 
floordiv () Pe 
—mod_() % 
一 pow_() 来 六 
—eq_()、—ne_()、 
A ==\l=.,<、<=、>、>= 
St _()、— se_() 
—lshift_()、 rshift_() -人 
rr A 
iadd_()、 isub_() + =、- = ,很 多 其 他 运算 符 也 有 与 之 对 应 的 复合 赋值 运算 符 
一 pos_() -元 运算 符 + , 正 号 
一 neg_() -元 运算 符 - , 负 号 





__contains _ () 


与 成 员 测 试 运算 符 in 对 应 





radd_().、 rsub_() 


反射 加 法 、 反 射 减 法 ,一般 与 普通 加 法 和 减法 具有 相同 的 功能 ,但 操作 
数 的 位 置 或 顺序 相反 ,很 多 其 他 运算 符 也 有 与 之 对 应 的 反射 运算 符 











—abs_() 与 内 管 函 数 abs( ) 对 应 
一 bool_() 与 内 答 函 数 bool( ) 对 应 ,要 求 该 方法 必须 返回 Tme 或 False 
—bytes_() 与 内 惫 函数 bytes( ) 对 应 





与 内 惫 函数 complex( ) 对 应 ,要 求 该 方法 必须 返回 复数 























_dir () 与 内 置 函 数 dir( ) 对 应 

divmod_() 与 内 置 函 数 divmod( ) 对 应 

—float_() 与 内 党 函数 float( ) 对 应 ,要 求 该 方法 必须 返回 实数 
_hash_() 与 内 秆 函数 hash( ) 对 应 

i 与 内 惫 函数 int( ) 对 应 ,要 求 该 方法 必须 返回 整数 
_len_() 与 内 秆 函数 len( ) 对 应 
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_next_() 


与 内 置 函数 next( ) 对 应 





_reduce_() 


提供 对 reduce( ) 函数 的 支持 


























_reversed_() 与 内 管 函 数 reversed( ) 对 应 

_round_() 对 内 置 函 数 round( ) 对 应 

str _() 与 内 秆 函数 str( ) 对 应 ,要 求 该 方法 必须 返回 str 类 型 的 数据 
一 repr () 打印 ,转换 ,要 求 该 方法 必须 返回 str 类 型 的 数据 

__ getitem__() 按照 索引 获取 值 

__setitem_() 按照 索引 赋值 

__delattr_() 删除 对 象 的 指定 属性 

getattr _() 获取 对 和 象 指定 属性 的 值 ,对 应 成 员 访 问 运算 符 "." 





getattribute_() 


获取 对 象 指定 属性 的 值 ,如 果 同 时 定义 了 该 方法 与 _getattr_() ,那么 _ 
_getattr __( ) 将 不 会 被 调用 ,除非 在 __getattribute__() 中 显 式 调用 
getattr _( ) 或 者 抛 出 AttributeError 异常 

















__setattr_ () 设置 对 象 指定 属性 的 值 
__base_ 该 类 的 基 类 

__elass_ 返回 对 象 所 属 的 类 

__dict__ 对 象 所 包含 的 属性 与 值 的 字典 
__subclasses_() 返回 该 类 的 所 有 子 类 

















ey 包含 该 特殊 方法 的 类 的 实例 可 以 像 函数 一 样 调用 
一 set 一 () 定义 了 这 3 个 特殊 方法 中 任何 一 个 的 类 称 为 描述 符 ( descriptor) ,描述 
A 符 对 象 一 般 作为 其 他 类 的 属性 来 使 用 .这 3 个 方法 分 别 在 获取 属性 、 修 
i 改 属 性 值 或 删除 属性 时 被 调用 


651 自 定义 队列 


6.5 精彩 案例 赏析 


队列 是 一 种 特殊 的 线性 表 , 只 允许 在 队列 尾部 插入 元 素 和 在 队列 头 部 删除 元 素 , 具 有 
“ 先 人 先 出 "(FIFO) 或 “后 人 后 出 ”"(LILO ) 的 特点 ,在 多 线程 编程 .作业 管理 等 方面 具有 重 


要 的 应 用 。 


Python 列表 对 象 的 append( ) 方 法 用 于 在 列表 尾部 追加 元 素 ,pop(0) 可 以 删除 并 返回 
列表 头 部 的 元 素 , 可 以 模拟 队列 结构 的 操作 。 


>>>x=[] 
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>>>x.append 0) 首尾 部 追加 元 素 ,模拟 入 队 操 作 
>>>x.append 2) 

>>>x.apend GB) 

>>>x 

[1,2,3] 

>>>x.pp (0) 寿 头 部 弹出 元 素 ,模拟 出 队 操 作 
全 

>>>x-Pop (0) 


2 


>>>x.poP (0) 

3 

>>>x 

0 

>>>x.pop (0) 闵 队列 弹出 头 部 元 素 失 败 , 抛 出 异常 

IndexError: Pop fran empty list 

从 上 面 的 代码 可 以 看 出 ,使 用 Python 列表 直接 模拟 队列 结构 ,无 法 限制 队列 的 大 小 ， 
并 且 当 列表 为 空 时 进行 弹出 元 素 的 操作 会 抛 出 异常 。 可 以 对 列表 进行 封装 ,增加 外 围 代 
码 , 自 定义 队列 类 来 避免 这 些 问 题 。 

示例 6-2 设计 自 定义 双 端 队列 类 ,模拟 入 队 .出 队 等 基本 操作 。 


class myDecpe: 
构造 方法 ,默认 队列 大 小 为 10 
Gef__init (selfiterable -None,mexlen30): 
if iterable==None: 
self._ ocntent =[] 
self。current -0 
else: 
Self._ content =list (iterable) 
Self. Current =len(iterable) 
Self. size exlen 
if self. size<self. Qamrent: 
Self. size=self. Arrent 


新 构 方法 
cf__del _ (self): 
Gel self。ccntent 


奏 改 队列 大 小 
GEf setsize (self, size) : 
if size <self。current: 
茹 1 果 缩小 队列 ,需要 同时 删除 后 面 的 元 素 
for i in range (size, self. current) [:: 41]: 
GEl self. content[i] 
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self。current =size 


self。size -size 


症 右 侧 人 队 
ef appendRight (selfvv) : 
if self. current <self. size: 
Self. ontent.append(v) 
Self. current =self. arrent 二 
else: 
Print ("Ihe queve js fu11') 


三 左 侧 和 人 队 
GEf apencreft (seafvv) : 
if self。current <self. size: 
self._ ontent.insert (0,v) 
Self. current =self. Qnrent } 
else: 
Print ("The queve js fu11') 


三 左 侧 出 队 
ef PoFreft (self) : 
if self。 ccontent: 
self。current =self. aQxrent -1 
retum self. omtent.pop(0) 
else: 
Print ("The queue is erpty') 


寿 右 侧 出 队 
Gef porRight (self) : 
if self._ omtent: 
Self。current =self. AQxrent 二 
retim self. omtent.pop() 
else: 
Print ("The queve js eampty') 


御 环 移 位 
def rotate (self,K) : 
证 abs 09 >self. omrrent: 
Print (kmst <=" +str(self. current)) 
rebm 
Self._ content -self. content[ -k:] +self. content[: -qd 


读 素 翻转 
GEf reverse (self) : 
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Self._ ontent =self. ontent[:: 1] 


声 示 当前 队列 中 元 素 的 个 数 
cef len _(salf): 
retum self. amrent 


竺 用 print 0 打印 对 象 时 ,显示 当前 队列 中 的 元 素 
def__str _ (self): 
reim mypeqpe(' +str(self. ontent) +',mexlen=" +str (self. size) +")" 


值 接 对 象 名 当 作 表 达 式 时 ,显示 当前 队列 中 的 元 素 
rpr = _str _ 


寺 列 置 空 

GEf clear (self) : 
self。ccntent =[] 
self。cumment -0 


调试 队列 是 否 为 空 
Gef isPmpty(self) : 
retim not self. omtent 


测试 队列 是 否 已 满 
GEf jsFul (self): 
retim self. amrrent ==self. size 


if_ ne _==' main _': 


Print (Please use me as a mocule.') 
将 上 面 的 代码 保存 为 myDeque. py 文件 ,并 保存 在 当前 文件 夹 .Python 安装 文件 夹 或 
sys. path 列表 指定 的 其 他 文件 夹 中 ,当然 也 可 以 使 用 append( ) 方 法 把 该 文件 所 在 文件 夹 
添加 到 sys. path 列表 中 。 下 面 的 代码 演示 了 自 定义 队列 类 的 用 法 : 


>>>fram myDecpe irport myDeqe 纯 入 自 定义 双 端 队列 类 
>>>q yDeqpe (range 5)) 枪 | 建 双 端 队列 对 象 
>>>Gq 

mybeqne([o,1,2,3,4]vnmexlen=a0) 

>>>q.appendreft ( 十) 首 队 列 左 侧 和 人 队 
>>>Gq.sEPencRight (5) 寿 队 列 右 侧 入 队 

>>>Gq 

myDeqpe ([ 1,0,1,2,3,4,5] ,maxlen 0) 

>>>q-popreft () 症 队 列 左 侧 出 队 


= 利 
>>>G-PoEEight 0 狂 队 列 右 侧 出 队 
时 
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>>>q.reverse() 斌 素 翻 转 
>>>G 
myDepe ([4,3,2,1,0] ,mexlen -40) 
>>>q.isEnpty() 铀 试 队列 是 否 为 空 
False 
>>>q-rotate( 3) 读 素 循环 左 移 
>>>q 
myDeqpe ([1,0,4,3,2] ,maxlen 10) 
>>>q.setsize (20) 数 变 队列 大 小 
>>>q 
myDeqpe ([1,0,4,3,2] ,mexlen =20) 
>>>q.clear() 请 空 队列 元 素 
>>>q 
myDecpe ([] ,maxlen =20) 
>>>q-isEnpty() 
True 


652 自 定义 栈 


栈 也 是 一 种 运算 受 限 的 线性 表 , 仅 允许 在 一 端 进行 元 素 的 插入 和 删除 操作 ,最 后 人 栈 
的 元 素 最 先 出 栈 , 最 先入 栈 的 元 素 最 后 出 栈 , 即 *“ 先 入 后 出 ”(FILO ) 或 “后 入 先 出 ” 
(LIFO ) 。 

使 用 Python 列表 对 象 提供 的 append( ) .pop( ) 方 法 也 可 以 模拟 栈 结构 及 其 基本 运算 ， 
但 是 无 法 限制 栈 的 大 小 ,并 且 在 栈 为 空 时 尝试 获取 其 元 素 时 会 引发 异常 。 

>>>s =[] 

>>>5.apendB) 站 尾部 追加 元 素 ,模拟 入 栈 操作 


>>>5.append (5) 

>>>5.append (7) 

>>>s 

[3,5,7] 

>>>5.pp0) 在 尾部 弹出 元 素 ,模拟 出 栈 操作 


>>>s-pop(0 列表 已 空 , 弹 出 失败 


如 同 封装 Python 列表 实现 自 定义 队列 类 一 样 ,也 可 以 对 Python 列表 进行 封装 来 模拟 


栈 结构 。 
示例 6-3 ”设计 自 定义 栈 类 ,模拟 入 栈 、 出 栈 、 判 断 栈 是 否 为 空 .是 否 已 满 以 及 改变 栈 


大 小 等 操作 。 
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Class Stack: 
构造 方法 
cef ”init _ (self,rexlen 0): 
self。content =[] 
Salf. size -mexlen 
self。current -0 


上 下 构 方法 ,释放 列表 控件 
cef __ol (salf): 
Gel self. contert 


精 空 栈 中 的 元 素 

GEf clear (self) : 
self。ccntent =[] 
self。cumment -0 


误 试 栈 是 否 为 空 
GEf jspty(self) : 
retim not self。ccntert 


政 改 栈 的 大 小 
Gef setSize (self, size): 
坏人 允许 新 的 栈 大 小 小 于 已 有 元 素数 量 
if size <self. arrent: 
Print ('new size mst >=' +str(self. orrent)) 
retum 
salf. size -size 


调试 栈 是 否 已 满 
GEf jsFull (self) : 
Tetum self。currert ==self. size 


堆栈 
GEf push (self,v) : 
if self。current <self. size: 
寿 列 表 尾 部 追加 元 素 
Self._ content.append (v) 
米 中 元 素 个 数 加 1 
Self。current =self. amrrent 世 


Print ('stack is FU!') 
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证 self. ontent: 
米 中 元 素 个 数 减 1 
Salf. current =self. arrent 二 
群 出 并 返回 列表 尾部 元 素 
retim self. omtent .pp() 
else: 
Print ('stack is empty!') 


cf__str _ (self): 
retim "Stack(' +str(self. omtent) +',mexlen="' +str(self. size) +')" 


复 用 __str 方法 的 代码 


rr = _str _ 

将 代码 保存 为 myStack. py 文件 ,下 面 的 代码 演示 了 自 定义 栈 结构 的 用 法 。 
>>>fram myStack import Stack 丁 和 人 自 定 义 栈 
>>>s=Stack( 利 建 栈 对 象 
>>>5.push (5) 妩 素 入 栈 
>>>5.push (8) 
>>>s.push('a') 
>>>s.pop() 村 素 出 栈 
‘a 
>>>5s.push('b') 
>>>s.push('c') 
>>>5 慎 看 栈 对 象 

Stack([5,8, 'b', 'c'] ,mexlen 310) 
>>>s.setsize(8) 巫 改 栈 大 小 


>>>5 

Stack ([5,8, 'b', 'c'] ,mexlen =8) 
>>>5.setsize (3) 

new size mst > 二 
>>>s.clear() 精 空 栈 元 素 
>>>5.isErpty() 

True 

>>>5.setsize 2) 

>>>s.push 0) 

>>>s-PushC) 

>>>s.push GB) 

Stack Ful! 


653 自 定义 集合 


Python 内 置 了 集合 类 型 ,支持 并 集 、 差 集 .交集 等 运算 ,并 且 不 允许 元 素 重复 。 本 节 案 
例 通 过 封装 Python 列表 模拟 了 集合 类 ,并 重 写 了 大 量 特殊 方法 ,模拟 了 集合 有 关 的 运算 。 
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示例 64 自 定义 集合 类 。 


class Set (Goject) : 
cf init _ (self,data None): 
if data=ne: 
sealf. _data=[] 
else: 
证 not hasattr(cdata,’ iter _'): 
卓 供 的 数据 不 可 迭代 ,实例 化 失败 
raise Erepticn(" 必 须 提 供 可 和 迭代 的 数据 类 型 ) 
teamp=[] 
for item in cata: 
竺 合 中 的 元 素 必 须 可 哈 希 
hash (item 
证 not item in tenp: 
terp.aEpenai(item 
self. _cata -tep 


盯 构 方法 
cef cel Gelf): 
ael salf. cata 


上 麻 加 元 素 ,要 求 元 素 必须 可 哈 希 
Gef acd (self,value): 
hash (value) 
if value nct in salf. _data: 
self。 _data.append (value) 
else: 
print(' 元 素 已 存在 ,操作 被 忽略 ') 


制 除 元 素 
GEf remcove (selfvvalue) : 
if value in self. _data: 
self. cata.remove (value) 
print (" 删 除 成 功 ) 
else: 
Erint(" 元 素 不 存在 ,删除 操作 被 忽略 ) 


娠 机 弹出 并 返回 一 个 元 素 
GEf pp (self) : 
证 not self。 catar 
Erirt(" 集 合 已 空 , 弹 出 操作 被 忽略 ) 
retum 
import rancom 
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item=random.doice (salf. _data) 
Self.  _data.remve (item) 
TeEtbum item 


姬 算 符 重 载 ,集合 差 集运 算 
df sb _(self,antherset): 
if not jsinstance (anptherset,Set) : 
Taise Erepticn(" 类 型 错误 
证 集合 
result =Set () 
上 妆 果 一 个 元 素 属于 当前 集合 而 不 属于 另 一 个 集合 ,添加 


垦 供 方法 ,集合 差 集运 算 , 复 用 上 面 的 代码 
GEf difference (self,anotherset) : 
retim self -anctherset 


州 运算 符 重 载 ,集合 并 集运 算 
GEf __or _ (self,anptherset) : 
让 not jsinstance (anptherset,Set) : 
raise Exosptian(' 类 型 错误 ') 
result =Set (self. _data) 


if item not in result. _data: 
result. _data.append (item) 
retim result 


姐 供 方法 ,集合 并 集运 算 
GEf unicn (self, anotherset) : 
retim self | anotherset 


在 运算 符 重 载 ,集合 交集 运算 
def__and _ (self,anotherset): 
if not isinstance (anotherset, Set) : 
raise Exosptian(' 类 型 错误 ') 
result =set () 
for item in self. _data: 
if item in anctherset- _data: 
result. _data.append (item) 
retim result 


196 J Python 程序 设计 开发 宝典 





. 


# 运 算 符 重 载 ,集合 对 称 差 集 
GEf xr _(self,anctherset): 
retum (self -anctherset) | (anotherset -self) 


刚 供 方法 ,集合 对 称 差 集 运算 
Gef symetric difference (self,anotherset) : 
retim self ^ anotherset 


全- 运算 符 重 载 ,判断 两 个 集合 是 否 相 等 
GE __eq _ (self,anotherset): 
if not isinstance (anptherset,Set) : 
raise Exosptian(' 类 型 错误 ') 
if sorted(self. _data) ==sorted(anotherset. _data): 
retim True 
retim False 


> 运算 符 重 载 ,集合 包含 关系 
cf _ gt _ (self,anotherset): 
if not jsinstance (anptherset,Set) : 
Iaise Eeeptian(' 类 型 错误 ') 
if self ! =anotherset: 
flaql =True 
for item in self。 _data: 


flaq False 
break 
fa =True 
for item in anptherset. _data: 
if item not in salf. _data: 
奶 一 个 集合 中 有 的 元 素 不 属于 当前 集合 
fa False 
break 
if mot flagl and flacp: 
retim True 
retim False 


杞 = 运算 符 重 载 ,集合 包含 关系 
df qe _ (self,anctherset): 
if not jsinstance (anptherset,Set) : 
raise Exosptian(' 类 型 错误 ') 
retim self ==anotherSet or self >anotherSet 


姐 供 方法 ,判断 当前 集合 是 否 为 另 一 个 集合 的 真子 集 
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CEf jssubset (self,anotherset) : 
retim self <anotherSet 


碍 供 方法 ,判断 当前 集合 是 否 为 男 一 个 集合 的 超 集 
GEf issuperset (self, anctherset) : 
Tetbum self >anctherset 


旭 供 方法 ,清空 集合 中 的 所 有 元 素 
GEf clear (self) : 
while self. _data: 
ael self. _cata[ 1] 
print (集合 已 清空 ') 


妈 算 符 重 载 ,使 得 集合 可 夫 代 
df__iter _(self): 
retim iter(salf. _data) 


凸 算 符 重 载 ,支持 也 运算 符 


坡 持 内 园 函 数 len0 
def__len _(salf): 
retum len(self. _data) 


值 接 查 看 该 类 对 象 时 调用 该 函数 
Gef__repr_ _ (elf): 
retum '{' +str (self。 _data) (1: 1] +'}" 


辣 用 print 0 函数 输出 该 类 对 象 时 调用 该 函数 





Str _ = repr 一 
把 这 个 文件 保存 成 mySet. py ,然后 就 可 以 像 下 面 的 代码 这 样 使 用 自 定义 集合 类 了 。 
>>>fram myset inport set 村 入 自 定义 集合 类 
>>>x =Set (range (10)) 创建 集合 对 象 


>>>Yy =Set (range (8,15)) 

>>>z =Set ([1,2,3,4,5]) 

>>>x 

{0,1,2,3,4,5,6,7,8,9} 

>>>y 

{8,9,10,11,12,13,14} 

>>>z.acd(6) 增加 元 素 
>>>z 

{1,2,3,4,5,6} 
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>>>z.remve G3) 
删除 成 功 

>>>z 

{1,2,4,5,6} 
>>>y.pop() 

11 

>>>x -了 
{0,1,2,3,4,5,6,7} 
>>>x 了 之 
{0,3,7,8,9} 
>>>x.difference (y) 
{0,1,2,3,4,5,6,7} 
>>xx 1y 


{0,1,2,3,4,5,6,7,8,9,10,12,13,14} 


>>>x.nian (y) 


{0,1,2,3,4,5,6,7,8,9,10,12,13,14} 


>>>x&z 

{1,2,4,5,6} 

>>>x 人 ^zZ 

{0,3,7,8,9} 

>>>x.symetric difference (Y) 
{0,1,2,3,4,5,6,7,10,12,13,14} 
>>& IY 
{0,1,2,3,4,5,6,7,10,12,13,14} 
>>>x==y 

False 

>>>x>y 

False 

>>>y >x 


>>>x>z 


>>>z.jssubset (x) 


>>>x.issuperset (z) 


>>3 inx 


E 


>>>33 inx 


>>>len (yy) 
6 


短 除 指定 元 素 


验 机 删除 一 个 元 素 


环 集 


群集 


婉 集 


寻 称 差 集 


测试 两 个 集合 是 否 相 等 


测试 集合 包含 关系 


蛮 试 z 是 否 为 x 的 子 集 


测试 x 是 否 为 z 的 超 集 


铀 试 集合 中 是 否 存 在 某 个 元 素 


寻 算 集合 中 元 素 的 个 数 
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>>>y-clear0 
集合 已 清空 

>>>y-pp0) 

集合 已 空 ,弹出 操作 被 忽略 


654 自 定义 数组 


示例 6-5 ” 自 定 义 一 个 数字 数组 类 ,支持 数组 与 数字 之 间 的 四 则 运算 ,数组 之 间 的 加 


法 运算 .内 积 运算 和 大 小 比较 ,数组 元 素 访 问 和 修改 ,以 及 成 员 测 试 等 功能 。 


Class MArray: 
"AL the elements in this array mst be mmiers' 
df__IsNnber (salf,n): 

retum jsinstance (n, (int, foat, omplex)) 


构造 方法 ,进行 必要 的 初始 化 
df__init _(self, * args) : 
if not args: 
self. _valnue=[] 
else: 
for arg in args: 
if not self. _IsNnber(arg): 
Print ('Al elements must be mmibers') 
rebm 
self。  _value Aist (args) 


下 构 方 法 ,释放 内 部 封装 的 列表 
GEf del _ (self): 
dal salf. _vale 


重 载 运算 符 + 
数组 中 每 个 元 素 都 与 数字 n 相 加 ,或 两 个 数组 相 加 ,返回 新 数组 
已 外 几 个 算术 运算 可 以 参考 这 个 方法 改写 和 扩展 
def__add _ (salf,n): 
if self. _ IsNnber m) : 
数组 中 所 有 元 素 都 与 数字 n 相 加 
b=MArray() 
b._ _value=[itemn for item in self. _value] 
Tetmmb 
elif isinstance (n,MyArray) : 
商 个 等 长 的 数组 对 应 元 素 相 加 
if lanm- velue) =~-Aen(salf. velue) : 


cMAarray() 
c. vale=[i+# fori,j inzip(salf. value,n. _value)] 
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IEbmmn C 
else: 
Print (Tength rot eqpal') 
else: 
Print (NE supported') 


重 载 运算 符 -, 数 组 中 每 个 元 素 都 与 数字 n 相 减 ,返回 新 数组 
aef sb (salf,n): 
if not self. _IsNnber (mn): 
Print (' -cperating with ',type o)，' and nmiber type js pot supported.') 
retm 
b=MArray() 
b. _value=[itemn for item in self. _value] 
IEtum Pb 


三 载运 算 符 * ,数组 中 每 个 元 素 都 与 数字 n 相 乘 ,返回 新 数组 
def ml (self,n): 
if not self. _IsNuibern) : 
Print ('* qperating with ',type n),' and nmiber type is nct supported. ') 
retm 
b=MArray() 
b._ _value =[item* n for item in self. _value] 


IEetum b 


三 载运 算 符 /数组 中 每 个 元 素 都 与 数字 n 相 除 , 返 回 新 数组 
Gef __trudiv _ (salf,n): 
if not self. _IsNuibern) : 
Print (r'/ qperating with ',type (n), ' and nmier type is not spported. ') 
retm 
b=MyArray() 
b._ _value =[itern for item in self. _value] 
Tetum b 


重 载 运算 符 //, 数 组 中 每 个 元 素 都 与 数字 n 整 除 , 返 回 新 数组 
Gf__floordiv _ (self,n): 
if not isinstance (ny, int) : 
print (n, ' is not an integer') 
rebim 
b=MyArray() 
b. _value=[itew/n for item in salf. _value] 
retmpb 


重 载 运算 符 s ,数组 中 每 个 元 素 都 与 数字 n 求 余数 ,返回 新 数组 
def__mda (self,n): 
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if not self. _IsNrber(n): 
Print Cr qperating with ',type (nh), ' and mnber type is mot supported.') 
Tetum 

b=MyArray() 

b. _vale=[itermn for item in self. _value] 

rebmpb 


重 载 运算 符 *% 数 组 中 每 个 元 素 都 与 数字 n 进 行 敌 计 算 , 返 回 新 数组 
aef pow _ (self,n): 
if not self. _IsNnber(n): 
Print (' ** aperating with ',type (n), ' ard rmber type is not supported. ') 
retum 
b=MyArray() 
b.。 _value =[item*mn for item in self. _value] 


IEtum Pb 


Cf __len _(self): 
retim len(self. _value) 


值 接 使 用 该 类 对 象 作 为 表达 式 来 查看 对 象 的 值 
Cef__repr _(self): 

epivalent to rehm "self。 _value' 

Tebum repr (self。 _value) 


坡 持 使 用 print 0 函数 查看 对 象 的 值 
a 
但 加 元 素 
cef apend(selfvw) : 
if not self. _ IsNinber (v): 
Print ('nly nnber can be appenced. ') 
Tetum 
self.。 _value.aEpendtw) 


符 取 指定 下 标的 元 素 值 ,支持 使 用 列表 或 元 组 指定 多 个 下 标 
Gf getitem _ (salf,index): 
lergth Alen (self. _value) 
效果 指定 单个 整数 作为 下 标 , 则 直接 返回 元 素 值 
jf isinstance (inces int) and 0 < =index <length: 
retim sealf. _valve[index] 
于 用 列表 或 元 组 指定 多 个 整数 下 标 
elif isinstance (index, Qistvbuple)) : 
for i in index: 
if not (isinstance (i,int) and 0<=i <length): 
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retim ‘index error’ 
result =[] 
for item in index: 
result .append (self.._value[item]) 
Tetum result 
else: 
retum ‘index error' 


艇 改元 素 值 , 支 持 使 用 列表 或 元 组 指定 多 个 下 标 , 同 时 修改 多 个 元 素 值 
def__setitem _ (self,index,value): 
lengih en (self. _value) 
茹 | 果 下 标 合 法 , 则 直接 修改 元 素 值 
if isinstance (index, int) and 0 < =index <length: 
self._ _value[index] walue 
破 持 使 用 列表 或 元 组 指定 多 个 下 标 
elif isinstance (index, (list, bple)): 
for i in index: 
证 ot (isinstance (i,int) and 0<=i <length): 
raise Excepticn ('index error') 
上 茹 果 下 标 和 给 的 值 都 是 列表 或 元 组 ,并 且 个 数 一 样 , 则 分 别 为 多 个 下 标的 元 素 修 
改 值 
if jsinstance (value, (list, bple)): 
if len(index) = 于 en (value) : 
for ivv in emerate (index) : 
self.。 _value[v] walue[i] 
else: 
raise Excepticn ('values and index must be of the same length') 
上 茹 果 指 定 多 个 下 标 和 一 个 普通 值 , 则 把 多 个 元 素 修改 为 相同 的 值 
elif isinstance (valie, (int, foat, omplex) ) : 
for i in index: 
salf. _value[i] walue 
else: 
raise Exoeptian ("value error'’) 
else: 
raise Exoeptian ("index error') 


彼 持 成 员 测试 运算 符 in, 测 试 数组 中 是 否 包含 某 个 元 素 
Gf__ontains _ (self,v): 
Tetbmm v jin salf. _value 


辜 拟 向 量 内 积 
Gef Got(selfvv) : 
证 not jsinstance (Vv,MyArray) : 
Print (v, ' mst be an instance of MArray.') 
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retum 
if lenty) ! en(salf. _vale): 
print ("The size must be eqpal.') 
rebm 
rebm sm([i* j for i,j in zip(salf. value,v. _value)]) 


重 载 运算 符 = 一 测试 两 个 数组 是 否 相 等 
Cf eq _ (sefv: 
if not isinstance (V,MyArray) : 
Erint (v, ' must be an instance of MyArray.') 
retim False 
retum salf. value=—. _velue 


重 载 运算 符 < 比较 两 个 数组 的 大 小 
cef __1t _(self/,v): 
if not isinstance (Vv,MyArray) : 
Print (v, ' mst be an instance of MArray.') 
retum False 
Tebum salf. _ vale Vv. _valie 


if_ ne _==' min _': 


prin ("Henee tee ne a AOAe. 0) 
将 上 面 的 程序 保存 为 MyArray. py 文件 ,可 以 作为 Python 模块 导入 并 使 用 其 中 的 数 
组 类 。 


>>>fram MyArray inport MArray 村 入 模块 中 的 自 定义 类 

>>>x MyArray (1,2,3,4,5,6) 羔 例 化 对 象 

>>>y MArray (6,5,4,3,2,1) 

>>>len (x) 版 回 数组 长 度 , 即 数组 中 的 元 素 个 数 
6 

>>>x 巧 每 个 元 素 加 5, 返 回 新 数组 
[6,7,8,9,10,11] 

>>>x* 3 三 个 元 素 乘 以 3, 返 回 新 数组 
[3,6,9,12,15,18] 

>>>x.cot (y) 寻 算 两 个 数组 (一 维 向 量 ) 的 内 积 
56 

>>>x.append 097) 三 数组 尾部 追加 新 元 素 

>>>x 

[1,2,3,4,5,6,7] 

>>>x.cot (y) 

The size mst be eqal. 

>>>x[9] -8 试图 修改 元 素 值 


Index type error or cut of range 
>>>x /2 
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[0.5,1.0,1.5,2.0,2.5,3.0,3.5] 
>>>x // 2 

W112253;3] 

>>>x $3 

[1,2,0,1,2,0,1] 

>>>x[2] 疲 回 指定 位 置 的 元 素 值 

3 

>>>'a' inx 抽 试 数组 中 是 否 包含 某 个 元 素 
False 

>>>3 inx 

True 

>>>x<y 比较 数组 的 大 小 

True 

>>>x MArray (1,2,3,4,5,6) 

>>>x +y 两 个 数组 中 对 应 的 元 素 相 加 ,返回 新 数组 
[ef Pr fe Pe Pry 

>>>x[[2,3,4]] 凌 看 多 个 位 置 上 的 元 素 值 
[3,4,5] 

>>>x[[2,3]] =[8,9] 后 时 修改 多 个 元 素 的 值 

>>>x 

[1,2,8,9,5,6] 

>>>x[[1,3,5]] -0 雯 多 个 元 素 赋值 为 相同 的 值 
>>>x 

[1,0,8,0,5,0] 


655 自 定义 双 链 表 


链表 是 常用 的 一 种 数据 结构 ,每 个 节点 都 有 左右 两 个 指针 用 来 指向 该 节点 的 前 、 后 
节点 ,支持 节点 的 双向 遍历 。 
示例 6-6 使 用 Python 模拟 双 链 表 结 构 。 


Class Node: 
"节点 结构 '"' 
Gef__init _ (self,data, leftNode =Nene, rightNode Nene): 
般 置 当前 节点 的 值 和 指向 下 一 个 节点 的 指针 
Self.cata =cata 
Self. left =leftNode 


Gef insertAfter (self,node): 
if mode.data=="HEAD': 
Print (‘You cannot make ancther head mode.') 
retim 
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三 当前 节点 后 面 插入 新 节点 ,要 考虑 当前 节点 是 否 为 最 后 一 个 节点 
if self.right ! None: 

node.left =self 

self.right mode 


Gef insertBefore (self,node) : 
if self.data=="'HEAD': 
Print ('You cannot insert node before the head node. ') 
retm 
if node.data =="'HEAD': 
Print ('You carnot make ancther head node. ') 
retim 


三 当 前 节点 前 面 插 入 新 节点 ,要 考虑 当前 节点 是 否 为 第 一 个 节点 
pnode.left =self.left 

if self.left ! None: 

node.right =self 

Self.left oe 


aef deleteRight (self) : 

删除 当前 节点 之 后 的 节点 

if self.right ==None: 
Print ('Nothing to celete') 
retm 

p=self.right 

if p.right ! None: 
Pp-right.left =self 

删除 节点 ,释放 空间 

delp 


Gef deletereft (self) : 
删除 当前 节点 之 前 的 节点 
p=self.left 
if p.data =="HEAD': 

print (Nbthing to delete.') 
Tetom 
self.left =p.left 
Pp-left.right -self 
删除 节点 ,释放 空间 
delp 
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败 节 点 
head poe (HERD') 


pead 
for i in range (1,10): 


入 次 生成 9 个 数字 ,并 创建 相应 的 节点 


把 节点 连接 到 链表 的 尾部 
nace (i) 
Pp-insertAfter (n) 

pn 


pead 


妨 历 链表 节点 ,插入 新 节点 ,删除 前 后 节点 


while p: 

if p.cdata==3; 
P-GeleteFight () 
P.Geletereft () 
P.insertBefore (Nboe (2.5)) 
P.insertAfter Nbae(G3.5)) 
break 

else: 
PP-rigt 


和 伍 向 毅 历 链表 并 输出 每 个 节点 的 值 
phead 


Print (p.data,end=" -一 >) 


板 向 遍历 链表 并 输出 每 个 节点 的 值 
ptail 
while p.cata ! ="'FEAD': 
Print (p.cata,end =" ——>') 
ppP.1left 
Print ('HEAD') 


656 自 定义 常量 类 


每 个 类 和 对 象 都 有 一 个 称 为 _dict__ 的 字典 成 员 , 用 来 记录 该 类 或 对 象 所 拥有 的 属 


性 。 当 访问 对 象 属性 时 ,首先 会 尝 i 
Python 内 置 类 型 不 支持 属性 的 增加 ,用 户 自 定 义 类 及 其 对 象 一 般 支 持 属 性 和 方法 的 增加 


在 对 象 属性 中 查找 ,如 果 找 不 到 就 到 类 属性 中 查找 。 


第 6 章 ， 代码 复 用 技术 (二 ) : 面向 对 象 程序 设计 = 207 
C 
\ 





与 删除 。 
在 下 面 定义 的 常量 类 中 ,要求 对 象 的 成 员 必 须 大 写 , 所 有 成 员 的 值 不 能 相同 ,并 且 不 


允许 修改 已 有 成 员 的 值 。 


>>>class Constants: 
GEf setattr _ (self,name,value): 
assert nare rot in salf. _dict ,You can not modify ' mare 
assert name.isupgper (), "Constant should be uppercase." 
assert value not in self. _dict _ .values(), "Value already exists." 
salf. _dict _ [nare] walue 


>> 交 =Constants () 

>>>t.R3B3 戌 员 不 存在 ,允许 添加 
>>>t.RA 三 员 已 存在 ,不 允许 修改 
RsserticnError: You can not modify R 

>>>t.GAA 

>>>t.g34 碱 员 必须 大 写 
RsserticnError: Constant should be uppercase. 

>>>t.B4 研 员 的 值 不 允许 相同 


RsserticrnError: Value already exists. 
也 可 以 使 用 Python 标准 库 collections 提供 的 namedtuple 对 象 来 实现 类 似 的 功能 ,不 
过 需要 提前 定义 好 属性 的 名 称 ,不 允许 添加 新 属性 ,也 不 允许 删除 已 有 属性 。 


>>>inport collecticns 


>>>Eoint -collections.namedbaple ('Foint' [x', 'y', '2"]) 划 | 建 一 个 类 
>>>El =Point (3,4,5) 人 疾 例 化 一 个 对 象 
>>>Hl .x 
3 

>>>pl.y 
4 

>>>H1.z 

5 

>>>p1.x=30 本 允许 修改 
tributeprror: can't set attribute 

>>>ELx 杯 允 许 增加 新 属性 
Attriputegrror: "Foint' doject has np attribute 't' 

>>>Gel pl.x 环 人 允许 删除 属性 


Attributerrror: can't delete attripute 


657 自 定义 不 允许 修改 值 的 字典 
与 6.5.6 节 的 思路 类 似 ,也 可 以 自 定义 不 允许 修改 值 的 字典 ,这 里 略 去 了 字典 其 他 方 
法 的 代码 ,可 以 参考 前 面 几 节 的 代码 进行 补充 和 完善 。 
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>>>class constpict: 
def ”init _ (self): 
salf. dict -dict() 
aef getiten _ (self,nane): 
retium self. _dict.get (name, "Not exists') 
cef __setitem _ (self,name,value): 
assert name not in self. _dict, 'Can not modify ' mane 


self-. _dict mame] alue 


>>>t =omnstDict () 
>>>t['a'] 冯 

>>>t['a'] 3 钙 多 许 修改 字典 中 的 值 
RsserticrnError: Can not modify a 

>>>t['a'] 

3 


658 自 定义 支持 wth 关 键 字 的 类 


如 果 自 定义 类 中 实现 了 特殊 方法 __enter__( ) 和 __exit__() ,那么 该 类 的 对 象 就 可 以 
像 内 置 函 数 open( ) 返 回 的 文件 对 象 一 样 支持 with 关键 字 来 实现 资源 的 自动 管理 。 


Class mryopen: 
df__init _(self,fileName,mde="r"): 


Self.fp=cpen (fileName,mode) 


GEf __enter _ (self): 
Tetmm sealf.fp 


Gf__edit _ (self,exeptianType,exosptiaWal,trace): 
self.fp.close() 


with myopen ('test.txt') as fh: 
Frint (fp.read()) 





多 文本 处 理 2 字符 串 


在 Python 中 ,字符 串 属于 不 可 变 有 序 序列 ,使 用 单 引 号 (这 是 最 常用 的 ,或 许 是 因为 
项 键盘 方便 ) 、 双 引号 、 三 单 引号 或 三 双 引 号 作为 定 界 符 ,并 且 不 同 的 定 界 符 之 间 可 以 互 
相 嵌 套 。 下 面 几 种 都 是 合法 的 Python 字符 串 : 
"abc'、"123'、' 中 国 '、"Python"、 Tom saig, "Tet's go" 
除了 支持 序列 通用 操作 (包括 双向 索引 、 比 较 大 小 `. 计 算 长 度 .元 素 访问 .切片 .成员 
测试 等 ) 以 外 ,字符 串 类 型 还 支持 一 些 特有 的 用 法 ,例如 字符 串 格式 化 查找、 替 换 排版 
等 。 但 由 于 字符 串 属于 不 可 变 序列 ,不 能 直接 对 字符 串 对 象 进行 元 素 增加 、 修 改 与 删除 等 
操作 ,切片 操作 也 只 能 访问 其 中 的 元 素 而 无 法 使 用 切片 来 修改 字符 串 中 的 字符 。 另 外 , 字 
符 串 对 象 提供 的 replace( ) 和 translate( ) 方 法 以 及 大 量 排版 方法 也 不 是 对 原 字符 串 直 接 进 
行 修 改 替 换 ,而 是 返回 一 个 新 字符 串 作 为 结果 。 
Python 支持 短 字符 串 驻 留 机 制 ,对 于 短 字符 串 ,将 其 赋值 给 多 个 不 同 的 对 象 时 , 内存 
中 只 有 一 个 副本 ,多 个 对 象 共享 该 副本 。 然 而 ,这 一 点 并 不 适用 于 长 字符 串 ,也 就 是 说 ,长 
字符 串 不 遵守 驻 留 机 制 , 当 把 一 个 长 字符 串 赋值 给 多 个 变量 时 ,这 些 变量 并 不 共享 相同 的 
内 存 地 址 。 
>>>a="'1234"' 
>>>p="'1234' 
>>>id(a) ==id 0) 旺 字 符 串 支持 内 存 驻 留 机 制 
True 
>>>a="'1234" * 50 
>>>p="'1234'* 50 


>>>ida) ==id@) 凡 字 符 串 不 支持 内 存 驻 留 机 制 
False 
>>>id(a[0]) ==id@[0]) ==id [4]) 街 个 字符 在 内 存 中 仍 只 有 一 份 
True 


如 果 需 要 判断 一 个 变量 是 否 为 字符 串 ,可 以 使 用 内 置 方法 isinstance( ) 或 type( ) 。 除 
了 支持 Unicode 编码 的 str 类 型 之 外 ,Python 还 支持 字 节 串 类 型 bytes ,str 类 型 字符 串 可 以 
通过 encode( ) 方 法 使 用 指定 的 字符 串 编码 格式 编码 成 为 bytes 对 象 , 而 bytes 对 象 则 可 以 
通过 decode( ) 方 法 使 用 正确 的 编码 格式 解码 成 为 sr 字符 串 。 另 外 ,也 可 以 使 用 内 置 函 
数 str( ) 和 bytes( ) 在 这 两 种 类 型 之 间 进 行 转 换 。 
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>>>type(" 中 国 ) 

<class 'str' > 

>>>type(" 中 国 '.encode (gak)) 编码 成 字 节 串 ,采用 GE 编码 格式 
<class 'bytes' > 

>>>pytes 3ytes 也 是 Pythcn 的 内 置 类 
<class "bytes' > 

>>>isinstance (" 中 国 str) 

True 

>>>type(' 中 国 ') ==str 

True 

>>>type(' 中 国 '.encode 0)) ==vtes 

True 

>>>' 中 国 '-encode0 雁 认 使 用 ET -8 进行 编码 
b' ved WB Vad ve5 oP Vid' 

>>> .decode () 积 认 使 用 ET -8 进行 解码 
"中 国 " 

>>>tytes (' 董 付 国 ','gok') 

b' vib6 Vad YB Vib6 Vib fa 

>>>str(_, 'gok') 

' 董 付 国 ' 


7.1 字符 串 编码 格式 简介 


最 早 的 字符 串 编码 是 美国 标准 信息 交换 码 ASCI, 仅 对 10 个 数字 .26 个 大 写 英文 字 
母 .26 个 小 写 英 文字 母 及 一 些 其 他 符号 进行 了 编码 。ASCII 码 采用 一 个 字 节 来 对 字符 进 
行 编码 ,最 多 只 能 表示 256 个 符号 。 

随 着 信息 技术 的 发 展 和 信息 交换 的 需要 ,各 国 的 文字 都 需要 进行 编码 ,不 同 的 应 用 领 
域 和 场合 对 字符 串 编码 的 要 求 也 略 有 不 同 , 于 是 又 分 别 设计 了 多 种 不 同 的 编码 格式 ,常见 
的 主要 有 UTF-8 .UTF-16 .UTF-32 .GB2312 .GBK `.CP936 、base64 .CP437 等 。UTF-8 对 全 世 
界 所 有 国家 需要 用 到 的 字符 进行 了 编码 ,以 一 个 字 节 表示 英语 字符 (兼容 ASCIT) ,以 3 个 
字 节 表示 中 文 ,还 有 些 语言 的 符号 使 用 2 个 字 节 (例如 俄语 和 和 希腊 语 符号 ) 或 4 个 字 节 。 
GB2312 是 我 国 制定 的 中 文 编码 ,使 用 一 个 字 节 表示 英语 ,2 个 字 节 表示 中 文 ;GBK 是 
GB2312 的 扩充 ,而 CP936 是 微软 公司 在 GBK 基础 上 开发 的 编码 方式 。GB2312 .GBK 和 
CP936 都 是 使 用 2 个 字 节 表示 中 文 。 

不 同 编码 格式 之 间 相 差 很 大 ,采用 不 同 的 编码 格式 意味 着 不 同 的 表示 和 存储 形式 ,把 
同一 字符 存 入 文件 时 , 写 入 的 内 容 可 能 会 不 同 , 在 试图 理解 其 内 容 时 必须 了 解 编码 规则 并 
进行 正确 的 解码 。 如 果 解 码 方法 不 正确 就 无 法 还 原 信息 ,从 这 个 角度 来 讲 , 字 符 串 编码 也 
具有 加 密 的 效果 。 

Python 3. x 完全 支持 中 文字 符 ,默认 使 用 UTF-8 编码 格式 ,无 论 是 一 个 数字 、 英 文字 
母 ,还 是 一 个 汉字 ,都 按 一 个 字符 对 待 和 处 理 。 在 Python 3. x 中 甚至 可 以 使 用 中 文 作为 变 
量 名 、 函 数 名 等 标识 符 , 这 在 示例 5-39 中 曾经 演示 过 。 





第 7 章 文本 处 理 ( 一 ) : 字符 串 = 





>>>import sys 
>>>sys.getdefaultencoding() 得 看 默认 编码 格式 

wtf 8" 

>>>s=' 中 国 山东 烟台 ，' 

>>>len(s) 疗 符 串 长 度 , 或 者 包含 的 字符 个 数 

6 

>>>s=' 中 国 山东 烟台 acrE' 利文 与 英文 字符 同样 对 待 ,都 算 一 个 字符 
>>>len(5) 

1 

>>> 姓 名 =" 张 三 ' 三 用 中 文 作为 变量 名 

>>>print 姓名 ) 答 出 变量 的 值 


Python 扩展 库 chardet 可 以 用 来 检测 字 节 串 所 采用 的 编码 格式 ,并 提供 一 个 可 信 度 以 


供 参 考 ( 有 时 候 可 能 不 准确 ) ,常用 来 判断 文本 文件 的 编码 格式 。 


>>>x=' 董 付 国 '.encoce() 

>>>dhardet .detect (x) 

{frconfidence': 0.87625, 'enooding': rutf -8'} 
>>xx=' 董 付 国 '.encode ('gok') 
>>>charcet.detect (x) 

fconficence': 0.73, encoding' : "wincows -1252"} 
>>>x=' 董 付 国 '.encode ('qce36') 

>>>dhardet .detect (x) 

{'omfidenge' : 0.73, "encoding' : 'windows -1252"} 


7.2 转 义 字符 与 原始 字符 串 


转 义 字符 是 指 , 在 字符 串 中 某 些 特定 的 符号 前 加 一 个 斜 线 之 后 ,该 字符 将 被 解释 为 另 


外 一 种 含义 ,不 再 表示 本 来 的 字符 。Python 中 常用 的 转 义 字符 如 表 7-1 所 示 。 


表 7-1 常用 的 转 义 字 符 
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转 义 字符 含义 转 义 字符 含义 
\b 退 格 ,把 光标 移动 到 前 一 列 位 置 \\ -个 斜 线 \ 

¥ 换 页 符 中 单 引号 ， 

换行 符 * 双 引号 " 

ea 加 在 \ooo | 3 位 八进制 数 对 应 的 字符 

vt 水 平 制 表 符 \xhh | 2 位 十 六 进 制 数 对 应 的 字符 

YY 垂直 制 表 符 Vuhhhh | 4 位 十 六 进 制 数 表示 的 Unicode 字符 





下 面 的 代码 演示 了 转 义 字符 的 用 法 : 
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S 
>>>print ('Hello morld') 候 含 转 义 字符 的 字符 串 
FElo 
World 
>>>print (' 101') 曼 位 八进制 数 对 应 的 字符 
A 
>>>print (' vA1') 至 位 十 六 进 制 数 对 应 的 字符 
A 
>>>print ("我 是 \LB463 Na4ecB \u56fd') 要 位 十 六 进 制 数 表 示 的 unicose 字 符 
我 是 董 付 国 


为 了 避免 对 字符 串 中 的 转 义 字符 进行 转 义 ,可 以 使 用 原始 字符 串 , 在 字符 串 前 面 加 上 
字母 或 R 表示 原始 字符 串 , 其 中 的 所 有 字符 都 表示 原始 的 含义 而 不 会 进行 任何 转 义 , 常 
用 在 文件 路 径 、URL 和 正则 表达 式 等 场合 。 


>>>print (path) 疗 符 由 被 转 义 为 换行 符 

C: Windows 

otepad.ee 

>>>path =r'C: Windows \notepad.ee' 妹 始 字符 串 ,任何 字符 都 不 转 义 


7.3 字符 串 格式 化 


731 使 用 % 符号 进行 格式 化 
使 用 % 符号 进行 字符 串 格式 化 的 形式 如 图 7-1 所 示 , 格 式 运算 符 % 之 前 的 部 分 为 格 
式 字符 串 , 之 后 的 部 分 为 需要 进行 格式 化 的 内 容 。 
% 站 吕 [0] [m] [Cn 格式 字符 % x 


仁 待 转换 的 表达 式 
格式 运算 符 
指定 类 型 


指定 精度 

指定 最 小 宽度 

指定 空位 填 0 

对 正 数 加 正 号 
指定 左 对 齐 输出 

格式 标志 ， 表 示 格 式 开 始 














图 7-1 字符 串 格式 化 


Python 支持 大 量 的 格式 字符 , 表 7-2 列 出 了 比较 常用 的 一 部 分 。 


第 7 章 文本 处 理 (一 ) : 字符 串 = 
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表 7-2 格式 字符 
格式 字符 说 明 格式 字符 说 明 
9%s 字符 串 (采用 str( ) 的 显示 ) Wx 十 六 进 制 整数 
or 字符 串 (采用 repr( ) 的 显示 ) oe 指数 (基底 写 为 e) 
Ke 单个 字符 %E 指数 (基底 写 为 EE) 
9%b 二 进 制 整数 %f .5%F | 浮 点 数 
%d 十 进 制 整数 %g 指数 (e) 或 浮 点 数 (根据 显示 长 度 ) 
%i 十 进 制 整 数 %G 指数 (E) 或 浮 点 数 (根据 显示 长 度 ) 
%o 八进制 整数 和 % 字符 % 


使 用 这 种 方式 进行 字符 串 格式 化 时 ,要 求 被 格式 化 的 内 容 和 格式 字符 之 间 必 须 一 一 
对 应 。 


>>>x 1235 

>>>s0="% 0" SX 

>>>so 

12323， 

>>>sh="%x" Sx 

>>>sh 

racey 

>>>se="%e" Sx 

>>>se 

"1 .235000e +03"' 

>>>"% s" $65 往 价 于 str0 

"65" 

>>>"% S" % 65333 

"65333" 

>>>'%d,%c' % (65,65) 重用 元 组 对 字符 串 进行 格式 化 , 按 位 置 进行 对 应 
65 

>>>"% d" $ "555" 赋 图 将 字符 串 转换 为 整数 进行 输出 , 抛 出 异常 
TypeError: $d fomat: a nnber is required,not str 

>>>'%s" $ [1,2,3] 

"[1,2,3]" 

>>>str((1,2,3)) 条 以 使 用 str0 函 数 将 任意 类 型 数据 转换 为 字符 串 
"(2,3)" 

>>>str([1,2,3]) 

"2,3]" 


732 使 用 format() 方 法 进行 字符 串 格 式 化 
除了 7.3.1 节 介 绍 的 字符 串 格 式 化 方法 之 外 ,目前 Python 社区 更 推荐 使 用 format( ) 
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方法 进行 格式 化 ,该 方法 非常 灵活 ,不 仅 可 以 使 用 位 置 进 行 格式 化 ,还 支持 使 用 关键 参数 
进行 格式 化 ,更 妙 的 是 支持 序列 解 包 格 式 化 字符 串 ,为 程序 员 提 供 了 非常 大 的 方便 。 

在 字符 串 格 式 化 方法 format( ) 中 可 以 使 用 的 格式 主要 有 b( 二 进 制 格式 ) .c( 把 整数 
转换 成 Unicode 字符 ) 、d( 十 进 制 格式 ) .o( 八进制 格式 ) x( 小写 十 六 进 制 格式 ) .X( 大 写 
十 六 进 制 格式 ) .e/E( 科 学 计数 法 格式 ) .f/F( 固定 长 度 的 浮 点 数 格式 ) .% (使 用 固定 长 
度 浮 点 数 显示 百分数 ) 。Python 3. 6. x 开始 支持 在 数字 常量 的 中 间 位 置 使 用 单个 下 画 线 
作为 分 隔 符 来 提高 数字 可 读 性 ,相应 地 ,字符 串 格式 化 方法 format( ) 也 提供 了 对 下 面 线 的 
支持 。 下 面 的 代码 演示 了 其 中 的 部 分 用 法 : 


>>>1/3 
0.3333333333333333 
>>>print ('{0:.3f} .fcommatG/3)) 哥 留 3 位 小 数 
0.333 
>>>"{0:% }" .fomat (3.5) 烙 式 化 为 百分数 
1350.000000% " 
>>>"'{0:_}, {0:_x}' .fomrat (1000000) fythcn 3.6.0 及 更 高 版 本 支持 
"1 _000 000, 王 4240' 
>>>'{0:_},{0:_x}'.fomrat (10000000) ”fython 3.6.0 及 更 高 版 本 支持 
'10_000 000,98_9680' 
>>>print (“Ihe ntnber {0:,} in hex is: {0:#},in oct is {0:}".fonrat (55)) 
The nnber 55 in hex is: 0x37,in oct is 0067 
>>>print ("The number {0:,} in hex is: {0:x},the number {1} in oct is {1:0}".format 
S5555)y 
The mniber 5,555 in hex is: 15b3,the muriber 55 in oct is 67 
>>>print ("The number {1} in hex is: {1: 椒 }, the number {0} in oct is {0:#o}".format 
(5555,55)) 
The mnber 55 in hex js: 0x37,the mnber 5555 in oct is 0cl2663 
>>>print ("my name is {namejvmy age is {age},and my is {ag}".fomrat (nere = "Dong", qq ="306467355", 
age =38)) 
TV name is Dong,my acP js 38,and my (0 js 306467355 
>>>positim =(5,8,13) 
>>>print ("x: {0[0] };Y:{0 0]};2:{0[2]}".fomrat (position) ) 
严 用 元 组 同时 格式 化 多 个 值 
XK:57Y:872:13 
>>>weather =[ ("Mnday", "rain"), ("Tuesday", "suny"), ("Wednesday", "suny"), (“Thirsday", "rain"), (" 
Friday", "cloudy") ] 
>>>fomatter —"Weather of "{0[0]}" is '{0[1]}'".fomat 
>>>for item in mep (fomratter, weather) : 
Print (item 
上 面 最 后 一 段 代码 也 可 以 改 为 下 面 的 写法 : 


>>>for item in weather: 
Print (fomatter (item) ) 
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733 格式 化 的 字符 串 常 量 


从 Python 3. 6. x 开始 支持 一 种 新 的 字符 串 格 式 化 方式 ,官方 称 为 Formatted String 
Literals ,其 含义 与 字符 串 对 象 的 format( ) 方 法 类 似 , 但 形式 更 加 简洁 。 


>>>name ="'Dong" 

>>>age =39 

>>>f'My nere js {nare},and I am {age} years old.' 
MY name is Dng,and I an 39 years old.' 

>>>wigdHth 310 

>>>precisim 4 

>>>wwalue 11/3 

>>>f'result: {value: {width} . {precision}}" 
'result: 3.667" 


734 使 用 Terplate 模板 进行 格式 化 


Python 标准 库 string 还 提供 了 用 于 字符 串 格式 化 的 模板 类 Template ,可 以 用 于 大 量 信 
息 的 格式 化 ,尤其 使 用 于 网 页 模板 内 容 的 替换 和 格式 化 。 例 如 : 


>>>fram string import Terplate 

>>>t Tarplate ('My nare js S${name},and is S${age} years old.') 枪 | 建 模板 
>>>d={ mame':' Dong' 'age' :39} 

>>>t.sibstitute (o) 冬 换 


'My name js Dong,and is 39 years old." 

>>>tt “Taplate ("My nane js $name,and js $age years old.') 
>>>tt.substitute (9 

My name is Dong,and is 39 years old." 

>>>htrml 一 ''' <html > <head > ${head} </head > <body > ${body} </body > </html >' 
>>>t Tarplate (tm) 

>>>d={ "head':'test", ‘body': "This is nly a test.'} 

>>>t.sbstitute (可 

1 <html > <head >test </head > <body AThis js nly a test. </body > </htrml >" 
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7.4 字符 串 常用 操作 


Python 字符 串 对 象 提供 了 大 量 方法 用 于 字符 串 的 检测 .替换 和 排版 等 操作 ,另外 还 有 
大 量 内 置 函 数 和 运算 符 也 支持 对 字符 串 的 操作 。 使 用 时 需要 注意 的 是 ,字符 串 对 象 是 不 
可 变 的 ,所 以 字符 串 对 象 提供 的 涉及 字符 串 “ 修 改 " 的 方法 都 是 返回 修改 后 的 新 字符 串 ， 
并 不 对 原 字符 串 做 任何 修改 ,无 一 例外 。 


741 find(0 rfind()index() rindex() .court() 


find( ) 和 rfind( ) 方 法 分 别 用 来 查找 一 个 字符 串 在 另 一 个 字符 串 指定 范围 (默认 是 整 
个 字符 串 ) 中 首次 和 最 后 一 次 出 现 的 位 置 ,如 果 不 存在 则 返回 - 1;index( ) 和 rindex( ) 方 
法 用 来 返回 一 个 字符 串 在 另 一 个 字符 串 指定 范围 中 首次 和 最 后 一 次 出 现 的 位 置 ,如 果 不 
存在 则 抛 出 异常 ;count( ) 方 法 用 来 返回 一 个 字符 串 在 另 一 个 字符 串 中 出 现 的 次 数 , 如 果 





不 存在 则 返回 0。 
>>>5 ="apple,peadh, banara, Peachv Pear” 
>>>5.find ("peach") 版 回 第 一 次 出 现 的 位 置 
6 
>>>s.find("Peach"7) 从 指 定位 置 开始 查找 
19 
>>>5.find ("peach",7,20) 任 指 定 范围 中 进行 查找 
二 
>>>s.rfind('p') 从 字符 申 尾 部 向 前 查找 
25 
>>>s.index('p') 版 回首 次 出 现 的 位 置 


1 

>>>5.index ('pe') 

6 

>>>5.index ("pear') 

25 

>>>5.index ("EP') 些 定 子 字 符 串 不 存在 时 抛 出 异常 
VBlusprror: sibstring not fomnd 

>>>s.comt ('p') 统计 于 字符 串 出 现 的 次 数 
5 

>>>5.comt ("ppP') 杯 存在 时 返回 0 

0 


一 般 来 说 ,实际 开发 时 应 优先 考虑 使 用 Python 内 置 函数 和 内 置 对 象 自身 提供 的 方 
法 ,运行 速度 快 ,并 且 运 行 稳定 。 下 面 的 代码 用 来 检查 长 字符 串 中 哪些 位 置 上 的 字母 是 
a, 通 过 运行 结果 可 以 发 现 , 使 用 字符 串 对 象 的 find( ) 方 法 的 速度 明显 要 比 逐 个 字符 比较 
快 很 多 。 
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fram string import ascii letters 
fran rancom import choice 
letters =….join([choice (ascii letters) for i in range (999999)]) 
def positions of character (sentencevch) : 千 用 字符 串 对 和 象 的 Ena0 方 法 
result =[] 
index <0 
jncex =sentence.find (dh, index 1) 
while index !=71: 
result .append (indez) 
incex =sentenoe.find (dh index 1) 
retim result 


Gef demo (s,0): 融通 方法 ,逐个 字符 比较 


for ivch in enumerate(s) : 李 可 以 使 用 列表 推导 式 改 写 


for £ in (positicns of character,Gemp) : 
Start =time () 
Positions =fE (letters, 'a') 
print (time () -start) 
运行 结果 为 如 下 : 
0.009000539779663086 
0.08400487899780273 


速度 居然 相差 10 倍 左右 ,这 看 起 来 是 惊人 的 。 然 而 ,如 果 把 上 面 代码 中 
1etters ="' .join([choice (ascii letters) for i in range (999999)]) 

改 为 
1etters ="' .join([choice (ab') for i in range (999999)]) 


然后 再 次 运行 ,会 发 现 结果 与 上 面 的 代码 恰好 相反 ,逐个 比较 的 方法 又 比 使 用 find( ) 方 法 
快 了 很 多 。 代 码 是 完全 一 样 的 ,只 是 所 查找 数据 的 “密度 "不 一 样 ,处 理 速度 却 有 着 翻天 
覆 地 的 变化 。 综 合 来 说 ,首先 应 该 分 析 待 处 理 的 数据 有 什么 样 的 特点 (例如 数据 种 类 数 
量 、 待 查找 元 素 的 分 布 密度 等 ) ,然后 才能 设计 最 优 的 算法 和 最 高 效 的 实现 方法 。 但 一 般 
情况 下 ,Python 内 置 函数 、 内 置 对 象 的 方法 和 标准 库 对 象 的 效率 要 高 于 自己 编写 的 代码 。 


742 sqlit() rspit() partition() rpartition() 
字符 串 对 象 的 split( ) 和 rsplit( ) 方 法 分 别 用 来 以 指定 字符 为 分 隔 符 ,从 字符 串 左 端 和 
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右 端 开始 将 其 分 隔 成 多 个 字符 串 ,并 返回 包含 分 隔 结果 的 列表 。 
>>>5 ="apple,peach, banara, pear™ 
>>>5.spLit (",") 千 用 逗号 进行 分 隔 


["apple", "Peach "panana", "pear"] 
>>>s ="2014 -10 -31" 


>>t.=5.split (" —") 三 用 指定 字符 作为 分 隔 符 
>>>t 

['2014","10"',°'31°"] 

>>>1ist trep (int,t)) 将 分 隔 结 果 转 换 为 整数 
[2014,10,31] 


对 于 split( ) 和 rsplit( ) 方 法 ,如 果 不 指定 分 隔 符 , 则 字符 串 中 的 任何 空白 符号 (包括 
空格 .换行 符 、 制 表 符 等 ) 的 连续 出 现 都 将 被 认为 是 分 隔 符 , 返 回 包含 最 终 分 隔 结果 的 
列表 。 


>>>5='hello world n\n My name is Dong 

>>>5.split () 

['hello', "world' My nare' 'is', 'Dong'] 

>>>5="' Nn\hello world nn NM name js Dang' 
>>>5.split() 

['hello', "world' "My are 'is', 'Dong'] 

>>>s=' Nhelo\t\t world nn nM nare\t is Dong ' 
>>>5.split () 

['hello', "world' My name', "is', 'Dong"] 


另外 ,split( ) 和 rsplit( ) 方 法 允许 指定 最 大 分 隔 次 数 (注意 ,并 不 是 必须 分 隔 这 么 


多 次 ) 。 
>>>5=' Nn\hello\t\t wrld mmN My nare js Dong " 
>>>5.split trexsplit 3) 和 份 隔 工 次 


['hello', world nn\n My nere is Dong '] 
>>>5.rsplit trexsplit 41) 
['n\rhelo\t\t wrld nnn My name is','Dong'] 


>>>5.spLlit texsplit =2) 

['hello', world', "My name is Dong '] 

>>>s.rsplit trexsplit 2) 

['n\nhelo\t\t wrld nn\n My name', "is 'Dong'] 

>>>s.sblit trexsplit 0) 乾 大 分 隔 次 数 可 以 大 于 实际 可 分 隔 次 数 


['hello', world', my name', "is', Dong'] 

调用 split( ) 方 法 如 果 不 传递 任何 参数 ,将 使 用 任何 空白 字符 作为 分 隔 符 , 如 果 字 符 
串 存 在 连续 的 空白 字符 ,split( ) 方 法 将 作为 一 个 空白 字符 对 待 。 但 是 ,明确 传递 参数 指定 
split( ) 使 用 的 分 隔 符 时 ,情况 略 有 不 同 。 

>>>'avvrkbyvcac" -spl 让 (9 紫 个 逗号 都 被 作为 独立 的 分 隔 符 
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Lar, db, rooc'] 
>>>'a\t\t \tb\t \tooc' .split (' \t') 每 个 制 表 符 都 被 作为 独立 的 分 隔 符 
av dp, roocr] 
>>>'a\t\t\tb\t \tooc' .split () 广 续 多 个 制 表 符 被 作为 一 个 分 隔 符 


ce 

字符 串 对 象 的 partition( ) 和 rpartition( ) 方法 以 指定 字符 串 为 分 隔 符 将 原 字 符 串 分 隔 
为 3 部 分 , 即 分 隔 符 之 前 的 字符 串 、 分 隔 符 字 符 串 和 分 隔 符 之 后 的 字符 串 。 如 果 指 定 的 分 
隔 符 不 在 原 字 符 串 中 , 则 返回 原 字 符 串 和 两 个 空 字符 串 。 如 果 字 符 串 中 有 多 个 分 隔 符 , 那 
么 partition( ) 把 从 左 往 右 遇 到 的 第 一 个 分 隔 符 作 为 分 隔 符 ,rpartition( ) 把 从 右 往 左 遇 到 的 
第 一 个 分 隔 符 作为 分 隔 符 。 


>>>5 —"apple, peach, banana, pear” 
>>>s.Partiticn( ') 朴 左 侧 使 用 逗号 进行 切 分 
(asEPle' ', ', "peach, banana, pear') 

>>>s.rpartition(', ') 姑 右 侧 使 用 逗号 进行 切 分 
('apple,peadh, banana', ', ', " 时 

>>>s5.IPartiticn (‘banana') 酚 用 字符 串 作 为 分 隔 符 


("apple,peah, ', ‘banana', ',pear') 
>>>'abababab' .partition('a') 
(wav rbababab') 

>>>'abababsb' .rpartitian('a') 
('ababab', 'a', pb) 


743 join() 
字符 串 的 join( ) 方 法 用 来 将 列表 中 多 个 字符 串 进行 连接 ,并 在 相 邻 两 个 字符 串 之 间 
插入 指定 字符 ,返回 新 字符 串 。 


>>>1i =["apple", "peach", "banana "Pear"] 
>>>ssp="," 


>>>ssp.join(1i) 壬 用 逗号 作为 连接 符 
"aFple,peadhy, banana, pear™ 

>>>"':'.join(i) 苇 用 冒号 作为 连接 符 
'apple:peah:banana:pear' 

>>>"" .join(1i) 千 用 空 字符 作为 连接 符 
'applepeadbananapear' 


使 用 split( ) 和 join( ) 方 法 可 以 删除 字符 串 中 多 余 的 空白 字符 ,如 果 有 连续 多 个 空白 
字符 ,只 保留 一 个 。 

>>>x 攻 一 'aaa hp cae FEE 

>>>' '.join(x.split()) 千 用 空格 作为 连接 符 


'asa Hb c de fff" 
>>>Gef equnavilent (s1,52): 制 | 断 两 个 字符 串 在 Pythcn 意义 上 是 否 等 价 
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if sl ==2: 
retum True 

elif ' '.join(sl.split0) ==" '.join(s2.spLlit0): 
retum True 

elif ''.join(sl.split()) ==""'.join(s2 .spHit(0)): 
retum True 

else: 
IEtbmm False 

>>>eqnavilent (pip list','pip 1ist') 


>>>eqpavilent (' [1,2,3]"," [1,2,3]') 删 断 两 个 列表 写法 是 否 等 价 


>>>eqpavilent (01,2,3]", 0,2 ,31") 


? 


>>>eqpavilent (' [1,2,3]"',' [1,2 ,3 ,4]') 
False 


744 lower() upper(), capitalize() ,title() snapcase() 


这 几 个 方法 分 别 用 来 将 字符 串 转换 为 小 写 .大 写字 符 串 ,将 字符 串 首 字母 变 为 大 写 ， 


将 每 个 单词 的 首 字母 变 为 大 写 以 及 大 小 写 互 换 , 生 成 新 字符 串 , 不 对 原 字 符 串 做 任何 
修改 。 
>>>s =What js Your Name?" 
>>>5.lower() 媒 回 小 写字 符 串 
"what is your name?" 
>>>5.upper() 是 回 大 写字 符 串 
WEAT IS YOR NAME?' 
>>>s.capitalize() 售 符 串 首 字母 大 写 
What is your name?" 
>>>5.title() 每 个 单词 的 首 字 母 大 写 
What Is Your Name?' 
>>>5.swapcase () 詹 小 写 互 换 


WEAT IS yOR AME?' 


745 replace() .maketrans() translate() 


字符 串 方 法 replace( ) 用 来 替换 字符 串 中 指定 字符 或 子 字符 串 的 所 有 重复 出 现 ,每 次 


只 能 替换 一 个 字符 或 一 个 字符 串 ,把 指定 的 字符 串 参数 作为 一 个 整体 对 待 ,类 似 于 Word 、 
WPS .记事 本 等 文本 编辑 器 的 查找 与 替换 功能 。 该 方法 并 不 修改 原 字符 串 ,而 是 返回 一 个 
新 字符 串 。 


>>>s 一 中 国 , 中 国 " 
>>>print (5.replace ("中 国 "," 中 华人 民 共 和 国 ")) 
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中 华人 民 共和 国 ,中华 人民 共 和 国 
>>>print (abocabc' replace ('abc', 'AEC')) 
PECnPC 


字符 串 对 象 的 maketrans( ) 方 法 用 来 生成 字符 映射 表 , 而 translate( ) 方 法 用 来 根据 映 
射 表 中 定义 的 对 应 关系 转换 字符 串 并 替换 其 中 的 字符 ,使 用 这 两 个 方法 的 组 合 可 以 同时 
处 理 多 个 不 同 的 字符 ,replace( ) 方 法 则 无 法 满足 这 一 要 求 。 

币 建 映射 表 , 将 字符 "abodef23" 一 一 对 应 地 转换 为 "uweyz@ 4" 
>>>table 一 '' .meketrans ('abodefl23', "Uywxyz@ #5') 

>>>5 ="Pythan is a greate Prograrming language. I like it!™" 

缔 映 射 表 进行 蔡 换 

>>>5.translate (table) 


"Bythcn is u gryuty progrming lungubgy. I liky it!' 


下 面 的 代码 使 用 maketrans( ) 和 translate( ) 方 法 实现 了 恺 撤 加 密 算法 ,其 中 k 表示 算 
法 密 钥 , 也 就 是 把 每 个 英文 字母 变 为 其 后 面 的 第 几 个 字母 。 


>>>inport string 

>>>Gef aisal(s,k) 
lower =string.ascii lowercase 州 \ 写 字母 
_UEPer =string.ascii uppercase 詹 写 字母 


after =lower[k:] +Icwer[:k] +upper[k:] +upper[:k] 
table ='' .mekstrans (before,after) 。 创建 映射 表 
retum s.translate (table) 


>>>s ="Pythan is a greate Prograrming language.。I like it!" 
>>>kaisa(s,3) 


"Sbwiad lv d juhahh surjudpplqj ccbjxrijh- L olrh lw!' 


>>>5 ="If the jmplerentaticn js easy to eplain, it may be a good icea." 
>>>aisal(s,3) 


‘Li with lpechFhewawlrd lv hevb wr hasodlg, Iw pdb eh d jrrg lgha.， 
746 strip() rstrip() strip() 


这 几 个 方法 分 别 用 来 删除 两 端 . 右 端 或 左 端 连续 的 空白 字符 或 指定 字符 。 


>>>s—"abc " 


>>>s2 =5.strip() 竹 除 空白 字符 
>>>s2 

>>> mVhello wonad mm'strip0 删除 空白 字符 
hello world’ 

>>>"aaaassdHf".strip (am 删除 指定 字符 


"sscHf" 
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>>>"aaaasscHf".strip (af 


>>>"aaaassdtifaaan.rstrip (am 删除 字符 串 右 端 指定 字符 
"aaaasscbif' 

>>>n"aaaassctfaaa".lstrip("am 删除 字符 串 左 端 指定 字符 
"sscafaaay 


这 3 个 函数 的 参数 指定 的 字符 串 并 不 作为 一 个 整体 对 待 ,而 是 在 原 字符 串 的 两 侧 . 右 
侧 ` 左 侧 删除 参数 字符 串 中 包含 的 所 有 字符 ,一 层 一 层 地 从 外 往 里 扒 。 


>>>'aabboccbeeeffg' .strip('af') 秆 母 工 不 在 字符 串 两 侧 ,所 以 不 删除 
"bbcccbeeeffg 

>>>'aabboccbeeeffg' .strip('gaf') 

Tbcccoeee' 

>>>'aabboccbeeeffg' .strip('gaef') 

beoua 

>>>'aabboccteeeffg' .strip('g-aef') 

i 

>>>"aakboccbeeeffg' .strip('goaefod') 


747 startswith() endsvith() 
这 两 个 方法 用 来 判断 字符 串 是 否 以 指定 字符 串 开始 或 结束 ,可 以 接收 两 个 整数 参数 
来 限定 字符 串 的 检测 范围 。 


>>>5 ='Beautifol is better than uglY-" 


>>>s.startswith('Be') 检测 整个 字符 串 
Te 

>>>s.startswith('Be',5) 由 定 检测 范围 的 起 始 位 竹 

False 

>>>s.startswith ("Be',0,5) 睛 定 检测 范围 的 起 始 和 结束 位 管 
True 


另外 ,这 两 个 方法 还 可 以 接收 一 个 字符 串 元 组 作为 参数 来 表示 前 级 或 后 级 ,例如 ,下 
面 的 代码 可 以 列 出 指定 文件 夹 下 所 有 扩展 名 为 bmp \jpg 或 gif 的 图 片 。 


>>>import os 
>>>[filename for filenaeme in os.1listdir(r'D:\\') if filename.endswith((' .hp',' .jpg',' .gif'))] 
748 isanumg ,isapha0 isdigit() iscecima() ,isnumeric0 isspaoe() 、 
isupper() ,isower() 


用 来 测试 字符 串 是 否 为 数字 或 字母 .是否 为 字母 .是 否 为 数字 字符 .是否 为 空白 字符 、 
是 否 为 大 写字 母 以 及 是 否 为 小 写字 母 。 
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>>>"1234apod' .isalnm() 
True 
>>>"'1234abod' .isalpra() 丛 部 为 英文 字母 时 返回 True 
False 
>>>"'1234abod' .isdigit () 栓 部 为 数字 时 返回 True 
False 
>>>'abcd' .isalFha () 
True 
>>>"1234.0' .isdigit () 
False 
>>>"'1234" .isdigit () 
True 
>>>' 九 '.isnmeric() smmeric () 方 法 支持 汉字 数字 
True 
>>>' 九 ' .isdigit() 
False 
>>>' 九 ' .isdeciral () 
False 
>>>'V HX ' .isdecinal () 
False 
>>>'V HX '.isdigit() 
False 
>>>'V HX '.isnmeric() 坡 持 罗马 数字 
True 


另外 ,Python 标准 库 unicodedata 还 提供 了 不 同形 式 数字 字符 到 十 进 制 数 字 的 转换 
方法 。 

>>>import nioodedata 

>>>unicodecata.numeric("27) 
2.0 

>>>unicocecata.numeric(" 九 ) 妈 字 数字 

9.0 

>>>unioodedata.nmeric('X ') 烛 马 数字 

10.0 


749 oanter() ljust() njust0 zill() 


这 几 个 方法 用 于 对 字符 串 进行 排版 ,其 中 center( ) ,ljust( ) .rjust( ) 返 回 指定 宽度 的 
新 字符 串 , 原 字符 串 居中 、 左 对 齐 或 右 对 齐 出 现在 新 字符 串 中 ,如 果 指 定 的 宽度 大 于 字符 
串 长 度 , 则 使 用 指定 的 字符 (默认 是 空格 ) 进行 填充 。zfll( ) 返 回 指定 宽度 的 字符 串 ,在 左 
侧 以 字符 0 进行 填充 。 


>>>'Hello world!' .oanter C0) 上 笑 中 对 齐 , 以 空格 进行 填充 
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' Flo world! ' 
>>>'Hello world!' center 20, ' =") 
'====Hello world! 

>>>'Hello world!' .1just (0, ' =") 
'Hello world! = i 








>>>'abc'.zEill1G) 
"ooakc' 
>>>'abc'.zEl1G) 
ce 

>>>"uio' .zfi1 (20) 
'00000000000000000Uio' 


7410 字符 串 对 象 支持 的 运算 符 


表 中 对 齐 , 以 字符 -进行 填充 
锤 对齐 

铬 对 齐 

故 左 侧 填充 数字 字符 0 


些 定 宽度 小 于 字符 串 长 度 时 ,返回 字符 串 本 身 


Python 支持 使 用 运算 符 ”+ "连接 字符 串 , 但 该 运算 符 涉 及 大 量 数据 的 复制 ,效率 非 
常 低 , 不 适合 大 量 长 字符 串 的 连接 。 下 面 的 代码 演示 了 运算 符 ” + ”和 字符 串 对 象 join( ) 


方法 之 间 的 速度 差异 。 
import timeit 


酚 用 列表 推导 式 生成 10000 个 字符 串 


Strlijst=['"This is a lcng string that will not keep in memory.' for n in range (10000)] 


配 用 字符 串 对 象 的 join0 方 法 连接 多 个 字符 串 


cef use join(): 
Tetumm ' .join (strlist) 


姜 用 运算 符 ” + 连接 多 个 字符 串 
GEf use_ plus(): 
result ="" 
for strtarp in strlist: 
result =result +strtemp 
retim result 


if_ ne _== min _': 
重复 运行 次 数 
times 1000 


jointimer timeit.Timer('use join)','frm main _ import use join') 
Print ("time for join: ', jointimer.timeit (nber tires)) 
Plustimer tineit.Tiner('use plus0','fran main _ import use plus') 
Print ("time for plus: ',plustimer.timeit (mber times)) 
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该 代码 分 别 使 用 join( ) 函数 和 ”+ ”对 10000 个 字符 串 进行 连接 ,并 重复 运行 1000 
次 ,然后 输出 每 种 方法 所 使 用 的 时 间 ,运行 结果 为 
time for join: 0.11133914429192587 
time for Plus: 1.6754796186748913 
修改 上 面 代 码 中 的 参数 会 发 现 , 随 着 字符 串 数量 的 增多 ,运算 符 ”+ "效率 会 越 来 越 
低 ,并 且 会 产生 大 量 的 垃圾 数据 ,严重 的 话 会 造成 大 量 内 存 碎片 而 影响 系统 的 运行 。 
另外 ,timeit 模块 还 支持 下 面 代码 演示 的 用 法 ,从 运行 结果 可 以 看 出 , 当 需 要 对 大 量 数 
据 进 行 类 型 转换 时 ,内 置 函数 map( ) 可 以 提供 非常 高 的 效率 。 
>>>import timeit 
>>>timeit .timeit ('" -".join (str (n) for n in range (100)) ',rniber 40000) 
重复 运行 10000 次 





0.3063435900577929 
>>>timeit.timeit('" —".join([str tn) for n in range (100)]) ',nniber 340000) 
0.27191914957273866 
>>>timeit .timeit ('" -".join rap (str, range (100) )) ' ,rimiber 40000) 
0.21119518171659024 
第 2 章 曾 经 介绍 过 ,Python 字符 串 支持 与 整数 的 乘法 运算 ,表示 序列 重复 ,也 就 是 字 
符 串 内 容 的 重复 。 
>>>'abod'* 3 
"abcoabocaboar 
最 后 ,与 列表 ,元 组 .字典 ,集合 一 样 ,也 可 以 使 用 成 员 测 试 运算 符 in 来 判断 一 个 字符 
串 是 否 出 现在 另 一 个 字符 串 中 ,返回 True 或 False。 
>>>"a" in "abode" 神 试 一 个 字符 中 是 否 存 在 于 另 一 个 字符 串 中 
True 
>>>'ac' in 'abade' 嵌 键 字 ip 左边 的 字符 串 作为 一 个 整体 对 待 
False 
>>>"j" not in "abode" 
True 
几乎 所 有 论坛 或 社区 都 会 对 用 户 提交 的 输入 进行 检查 ,并 过 滤 一 些 非法 的 敏感 词 ,这 
极 大 地 促进 了 网 络 文明 和 净化 。 这 样 的 功能 可 以 使 用 关键 字 in 和 replace( ) 方 法 来 实现 。 
下 面 的 代码 用 来 检测 用 户 输 入 中 是 否 有 不 允许 的 敏感 字 词 ,如果 有 就 提示 非法 。 
>>wwords =(' 测 试 ， "非法 "暴力 ) 
>>>text 一 input(" 请 输入 : ) 
请 输入 : 这 句 话 里 含有 非法 内 容 
>>>for word in words: 
if word in tezt: 
Erzint(" 非 法 ) 
break 
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else: 
print ("正常 ') 
下 面 的 代码 则 可 以 用 来 测试 用 户 输 入 中 是 否 有 敏感 词 , 如 果 有 的 话 就 把 敏感 词 替 换 
个 星 号 * * * 。 
>>wwords =(' 测 试 ', "非法 ',' 暴 力 ',' 话 ') 
>>>text =' 这 人 句 话 里 含有 非法 内 容 ' 
>>>for word in words: 
if word in text: 
text =text.replace (word,'* * * ') 
>>>text 
"这 名 * * * 里 含有 * * * 内 容 ' 
或 者 直接 使 用 正则 表达 式 模块 re 提供 的 函数 进行 检查 和 过 滤 : 
>>wwords =(" 测 试 ， "非法 "暴力 …" 话 ) 
>>>text =' 这 人 句 话 里 含有 非法 内 容 ' 
>>>inport re 
>>>re.sub(' |'.join(words),'* * * ',text) 
' 这 名 * * * 里 含有 * * * 内容 ' 


7411 适用 于 字符 串 对 象 的 内 置 函 数 


除了 字符 串 对 象 提 供 的 方法 以 外 ,很 多 Python 内 置 函 数 也 可 以 对 字符 串 进行 操作 。 
>>>x ="'HeEllO world." 

>>>len (x) 疗 符 串 长 度 

12 

>>>mex(Cx) 最大 字符 

wr 

>>>min (x) 

>>>1ist (zip(x,»)) 此 ip0 也 可 以 作用 于 字符 串 


[OH He re) (ID) (1), (‘ooN), (sr WD), (WW), ov oo) (rr), (l,l 
DCA dD),(.','.")] 

>>>sorted co 

[Hd ,el "0, Oo, rw] 

>>>1ist (reversed (x)) 

[dl Tr Ol, Ws ,01 "er, HE] 

>>>1ist (errmerate (2 ) 

[©,'H), Q,'e), C1), B,'1"), (4,'0), GV), (6 WwW), (0), (8, rT), (39,1"), 0,'9), 01,'.')] 
>>>1ist (rep (larbbda i,j: i141,x,2)) 

[HH ee l,l, co ww op Tv Lv ca 


内 置 函 数 eval( ) 用 来 把 任意 字符 串 转 化 为 Python 表达 式 并 进行 求 值 。 
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>>>eval (3 4") 计算 表达 式 的 值 
>>>a 二 
>> 冲 二 
>>>eval ('a tp') 化 时 候 要 求 变量 a 和 b 已 存在 
8 
>>>import math 


>>>eval (math.sqrt G3) ') 

1.7320508075688772 

在 Python 3.x 中 ,input( ) 将 用 户 的 输入 一 律 按 字符 串 对 待 ,如果 需 要 将 其 还 原 为 本 
来 的 类 型 ,对 于 简单 的 整数 .实数 .复数 可 以 直接 使 用 int( ) \float( ) 和 complex( ) 函数 进行 
转换 ,而 对 于 列表 、 元 组 或 其 他 复杂 结构 则 需要 使 用 内 置 函 数 eval( ) ,不 能 使 用 list( ) 、 
tuple( ) 直接 进行 转换 。 不 管 是 使 用 int( ) 、float( ) 和 complex( ) 函数 还 是 eval( ) 函数 ,在 
转换 时 最 好 配合 异常 处 理 结构 ,以 避免 因为 数据 类 型 不 符合 要 求 或 者 无 法 正确 求 值 而 抛 
出 异常 。 

>>>x “irput() 

357 

>>>x 

1357' 

>>>eval (x) 

357 

>>>x “input() 

[3,5,7] 

>>>x 

1[3,5,7]" 

>>>eval (x) 广 意 ,这 里 不 能 使 用 list 中 进行 转换 

[3,5,7] 

>>>x irput() 


>>>try: 碳 前 作用 域 中 不 存在 变量 zc 


wang imptt 

Python 的 内 置 函 数 eval( ) 可 以 计算 任意 合法 表达 式 的 值 ,如 果 有 恶意 用 户 巧 妙 地 构 
造 并 输入 非法 字符 串 ,可 以 执行 任意 外 部 程序 或 者 实现 其 他 目的 ,例如 ,下 面 的 代码 运行 
后 可 以 启动 记事 本 程序 : 


>>>a Jirput ('Please irput a value:') 
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Flease irput a value: _inport _('05") .startfile(r'C: Windows \\notepad.ee') 

>>>eval (a) 

下 面 的 代码 则 会 导致 屏幕 一 闪 ,瞬间 在 当前 文件 夹 中 创建 了 一 个 子 文件 夹 testtest: 

>>>eval "jimport _('05') .system(md testtest')") 

因此 ,如 果 我 们 的 程序 中 有 使 用 内 置 郊 数 eval( ) 对 用 户 输入 的 字符 串 求 值 的 代码 ,一 
定 要 检查 用 户 输入 的 字符 串 中 是 否 有 危险 的 字符 串 并 对 这 些 特殊 的 字符 串 进 行 必 要 的 过 
滤 , 例 如 "import__('os")." ,否则 就 很 容易 引发 很 多 安全 问题 。 当 然 , 也 可 以 使 用 标准 库 
ast 提供 的 安全 函数 literal_eval( ) 。 


7412 字符 串 对 象 的 切片 操作 
切片 也 适用 于 字符 串 , 但 仅 限于 读 取 其 中 的 元 素 ,不 支持 字符 串 修改 。 


>>>"Eplicit is better than inplicit.'[:8] 
"ERplicit 

>>>'Explicit is better than inplicit.' [9:23] 
"is better than' 

>>>path 一 'C: \\ython35 \\test .bmp' 
>>>path[: -4] +' new' +path[ -4:] 

'C: \\Python35 \Nbest_new.bmpy 


7.5 其 他 有 关 模 块 





751 tetwrap 模块 


前 面 介绍 的 center( ) ,ljust( ) 等 字符 串 方 法 支持 一 定 的 排版 功能 , 除 此 之 外 ,Python 
标准 库 textwrap 提供 了 更 加 友好 的 排版 函数 。 

(1) wrap( text, width = 70) 函数 对 一 段 文 本 进行 自动 换行 ,每 一 行 不 超过 width 个 
字符 。 

>>>import tezxtwrap 

>>>Gpc ="'"' "Beautiful is better than ugly. 

Explicit is better than implicit。 


Special cases aren't special enough to break the mles. 
Although practicality beats purity.""" 

>>>import pprint 

>>>pprint .pprint (textwrap.wrap (Goc)) 区 认 长 度 最 大 为 70 
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["Besutifil is better than ugly- Eplicit is better than inmplicit.', 
"Simple is better than oplex. Camplex is better than omplicated.", 
"at is better than nested. Sparse is better than dense. Feadspbility', 
"counts- Special cases aren't special encugh to break the rules.", 
'Although practicality beats purity. '] 


(2) fil(text，width =70) 函数 对 一 段 文 本 进行 排版 和 自动 换行 ,等 价 于 \n'. join( wrap 
(text,…) )。 


>>>Erint (textwrap.£i1] (doc,width =20)) 由 指 定 宽度 进行 排版 

"Beautifil is better 

than ugly. Eplicit 

is better than 

inplicit. sirple is 

better than omplex. 

Cnplex is better 

than ooplicated. 

Flat js better than 

nested. Sparse is 

better than dense. 

FeacEbility comts. 

Special cases aren't 

Special enough to 

break the rules. 

Althouh 

practicality beats 

Purity. 

>>>print (textwrap.fil] (doc,width =80)) 幢 指 定 宽度 进行 排版 

"Beautiful is better than ugly. Explicit is better than implicit. sinple is 

better than amnplex. Carplex is better than orplicated. Flat is better than 

nested. Sparse is better than dense. Readebility oonts. Special cases aren't 

special encucgh to break the rules. Although practicality beats purity. 

(3) shorten( text，width ，* 永 wargs) 函数 截断 文本 以 适应 指定 的 宽度 。 该 函数 首先 把 
文本 中 的 所 有 连续 空白 字符 替换 (或 折 付 ) 为 一 个 空白 字符 ,如 果 能 够 适应 指定 的 宽度 就 
返回 ,否则 就 在 文本 尾部 丢弃 足够 多 的 单词 并 替换 为 指定 的 占 位 符 。 


>>>fram textwrap :import shorten 

>>>shorten('HELo world!',widtih=45) 例 度 足以 容纳 所 有 字符 
"Hello world!' 

>>>shorten ('HEllo world!',width 40) 指定 的 宽度 太 小 


5 
>>>shorten (HEEII world!',widh 41) 

‘Helo [77] 

>>>shorten('HeEllo worlg!',widHh 1,placsholoer ="'.") 蕴 定 占 位 符 
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>>>shorten('HElo world!',width 二 1,placsholoer ="…') 车 用 不 同 的 占 位 符 
>>>shorten ("HEEIIO world!',widh 起 ,placsholger ="…') 糙 定 的 宽度 太 小 


(4) indent(text，prefix ，predicate = None) 函数 对 文本 进行 缩 进 并 为 所 有 非 空 行 增加 
指定 的 前 导 字 符 或 前 级 ,通过 predicate 可 以 更 加 灵活 地 控制 为 哪些 行 增加 前 导 字 符 。 


>>>fram textwrap import indent 
>>>exenple 一 
hello 


goad" 
>>>print (indent (exanple, ' +' * 4)) 上 英 认 为 所 有 非 空 行 增加 前 级 
++++hello 

十 二 十 十 “WOld 

十 + 十 十 己 


十 二 十 +GPod 

>>>print (incent (exanple, ' +' * 4, lanbda line:True)) 鸯 所 有 行 增 加 前 级 

汪 吴 壮举 

二 + 二 +hello 

十 十 二 十 “WEIld 

bid ho st | 

十 十 十 十 

十 + 十 +GPod 

>>>print (incdent (exanple, ' +' * 4, lanbda line:len (line) 3)) 惧 为 长 度 小 于 3 的 行 增加 前 缀 


十 十 十 十 


(5) dedent( text) 函数 用 来 删除 文本 中 每 一 行 的 所 有 公共 前 导 空白 字符 。 


>>>fram textwrap inport dedent 
>>>exanple ="'"" 
hello 


>>>print (Gedent (esenple)) 
hello 
world 
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good 


(6) TextWrapper 类 。 

前 面 介绍 的 wrap( ) ,fil( ) .shorten( ) 函数 在 内 部 都 是 先 创建 一 个 TextWrapper 类 的 
实例 ,然后 再 调用 该 实例 的 方法 。 如 果 需 要 频繁 调用 这 几 个 函数 的 话 ,就 会 重复 创建 
TextWrapper 类 的 实例 ,严重 影响 效率 ,可 以 创建 TextWrapper 类 的 实例 然后 再 调用 该 实例 
的 方法 。 


>>>fran textwrap inport TextWrapper 

>>>wrapper =TextWrapper (widHh =70, initial indent =" +',placsholder ="……* ') 

>>>print (wapper.wrap ('hello world' * 40)) 

[' +hello worldhello worldhello worldhello worldhello worldhello', 'worldhello worldhello worlGhello 
worlohello worldhello worldhello', 'worldhello worldhello worldhello worldhello worldhello worlchello 
', " worlohello worldhello worldhello worldhello worldhello worldhello ', ' worlchello worldhello 
worldhello worldhello worldhello worldhello', "worldhello worldhello worldhello worldhello worlchello 
worlchello' "worldhello worldhello worldhello worldhello worlga'] 

>>>print (wrapper.fill ('hello world' * 40)) 

+hello worldhello worlchello worldhello worlchello womlchello 

worlchello worldhello worldhello worlchello worldhello worldhello 

worlohello worlchello worldhello worldhello worldhello worlchello 

worchello worlchello worldhello worldhello worldhello worlchello 

worlchello worlchello worldhello worldhello worldhello worlchello 

worlchello worlchello worldhello worldhello worldhello worlchello 

worlohello worldhello worldhello worldhello world 
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Pytho 标准 库 zlib 中 提供 的 compress( ) 和 decompress( ) 函数 可 以 用 于 数据 的 压缩 和 
解压 缩 ,在 压缩 字符 串 之 前 需要 先 编码 为 字 节 串 。 


>>>import zlib 

>>>x='Python 程序 设计 系列 图 书 , 董 付 国 编著 ,清华 大 学 出 版 社 '.encoce() 

>>>len (x) 
72 

>>>y =z1ib.ompress (x) 

>>>len(y) 娃 于 重复 度 比较 小 的 信息 ,压缩 比 小 
83 

>>>x=('Python 系列 图 书 '* 3) .encode0) 

>>>len (x) 

54 

>>>y zlib.onpress (Co 着 息 重复 度 越 高 ,压缩 比 越 大 
>>>len(y) 

30 

>>>z 一 lib.decarpress(y) 

>>>len (z) 
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>>>Z.Gecoce () 


"Python 系列 图 书 Pythan 系列 图 书 Python 系列 图 书 ' 
>>>x=[' 董 付 国 '] 闪 

>>>y =str 6) .encode (\) 

>>>len(y) 

104 

>>>z 一 ]ip.compress (y) 

>>>len(z) 

26 


>>>z1ib.deoqpress (z) .Gecode () 
"[' 董 付 国 ',' 董 付 国 ',' 董 付 国 ',' 董 付 国 ',' 董 付 国 ',' 董 付 国 ',' 董 付 国 ',' 董 付 国 ']" 


7.6 字符 串 常量 
Python 标准 库 string 提供 了 英文 字母 大 小 写 .数字 字符 .标点 符号 等 常量 ,可 以 直接 
使 用 。 下 面 的 代码 实现 了 随机 密码 生成 功能 。 
>>>inport string 


>>>x =string.digits +string.ascii letters +string.pmncbatim 
何 能 的 字符 集 


可 能 对 字 节 串 进行 压缩 


>>>x 
'0123456789abodefghijklrmopqrstbiwwxyzABCEFGHIJKIMICOEGRSTOVWAYZ! "HSS EN" () * + —./:? <=>3@ [NJ~ ~ 
和 县 才 不 

>>>inport random 


>>>Gef generatestrongewi (kK) : 性 成 指定 长 度 的 随机 密码 字符 串 
retim '' .join( (randam.dpoice (x) for i in range (W))) 

>>>generatestrongPwd(8) 如 位 随机 密码 

'@ <IR $i' 

>>>generateStrongPwd (8) 

‘ou:E HYV' 

>>>generatestrongPwdi(15) &5 位 随机 密码 


MO |O* 7Gwiu..e/ 


7.7 可 变 字 符 串 


在 Python 中 ,字符 串 属于 不 可 变 对 象 , 不 支持 原 地 修改 ,如 果 需 要 修改 其 中 的 值 ,只 
能 重新 创建 一 个 新 的 字符 串 对 象 。 如 果 确 实 需要 一 个 支持 原 地 修改 的 UNICODE 字符 串 
对 象 ,可 以 使 用 io. StringIO 对 象 或 array 模块 。 

>>>fran io import stringro 

>>>s ="FELO worlg™" 

>>>sio =StringIo(s) 利 建 可 变 字符 串 对 象 


>>>sio 
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<_io.stringro cbject at 0x0000000003096EEB > 

>>>sio-tell0 旺 回 当前 位 置 
0 

>>>sio.read() 类 当前 位 置 开始 读 取 字 符 串 
"Hello worlg' 

>>>sio.getvalue () 彼 回 可 变 字符 串 的 全 部 内 容 
'Helo world’ 

>>>sio.tell() 

1 

>>>sio.seek(6) 重新 定位 当前 位 置 

6 

>>>sio.write('sDIET') 类 当前 位 置 开始 写 入 字符 串 , 自 动 移动 指针 
5 

>>>sio.read() 扒 当 前 位 置 开 始 读 取 字符 串 
>>>sio.getvalue () 

'Hello SDIET' 

>>>sio.tell() 

过 

>>>5s ="Hello worlg" 

>>>fram array import array 

>>>sa =array ('u',s) 创建 可 变 字符 串 对 象 
>>>print (sa) 

array ('u', 'Hello world') 

>>>print (sa.tostring()) 性 看 可 变 字符 串 对 象 内 容 
P'HNOOe \xO01 DO01 \x000 YD0 \xOOW DO0o DOr \xD01 \xO0d \xO0' 

>>>print (sa.tounicode 0) 性 看 可 变 字符 串 对 象 内 容 
Hello world 

>>>sa[0] ='F' 月 改 指定 位 置 上 的 字符 
>>>print (sa) 

array ('u', 'Fello world') 

>>>sa.insert (5, 'w') 症 指 定位 置 插入 字符 
>>>print (sa) 

array ('u', 'Fellow world') 

>>>sa.rerve('1') 删除 指定 字符 的 首次 出 现 
>>>print (sa) 


array ('u', 'Felow world') 
>>>sa.remve('w') 
>>>print (sa) 

array ('u', 'Felo world') 


7.8 中 英文 分 词 


如 果 字 符 串 中 有 连续 的 英文 和 中 文 ,可 以 根据 字符 串 的 规律 自己 编写 代码 将 其 切 分 。 
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x=' 狗 gcg 猎 cat 杯子 cp 桌子 taple 你 好 ' 
c=[] 
e=[] 


Ee 
for ch in x: 读 提 取 英 文 
if 'a' <=h<='z' or 'A' <=h<='2": 
七 +=h 
elif t: 
e.Pped(t) 
七 = 
直上 
e.append (t) 
二 ma 
for ch in x: 大 提取 中 文 
if 0x4e00 <=ord(ch) <=0x9fa5: 肉 本 汉字 UNIccrE 编码 范围 
t +=h 
elif t: 
c.append(t) 
t="" 
ift 
Cc.atpend(t) 
t="" 
print (c) 
print (e) 


Python 扩展 库 jieba 和 snownlp 很 好 地 支持 了 中 文 分 词 ,可 以 使 用 pip 命令 进行 安装 。 
在 自然 语言 处 理 领域 经 常 需要 对 文字 进行 分 词 , 分 词 的 准确 度 直接 影响 了 后 续 文本 处 理 
和 挖掘 算法 的 最 终 效果 。 


>>>inport jieba 枉 和 人 jisra 模 块 
>>>x='" 分 词 的 准确 度 直接 影响 了 后 续 文 本 处 理 和 挖掘 算法 的 最 终 效果 。，' 
>>>jisba.at (x) 千 用 默认 词 库 进行 分 词 
<generator doject Tbkenizer.art at 0x000000000342C990 > 

>>>list( ) 

5" 分词， "的 "准确 度 … ' 直 接 … "影响 "了 "后续 "文本 处 理 , "和 "， 挖掘" "算法 … "的 "最终 
歼 果 …'。 

>>>list isba.at(" 纸 杯 )) 

5" 纸杯 9 

>>>list jisba.at(" 花 纸杯 0)) 

[" 花 % "纸杯 9 

>>>jisba.ac word(' 花 纸杯 ') 媒 加 词 条 

>>>list jisba.at(" 花 纸杯 0)) 硅 用 新 题库 进行 分 词 

[5" 花 纸杯 9 
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>>>import sncownlp 朵 入 snowunp 模 块 
>>>snownlp-SnoNLP(" 学 而 时 习 之 ,不 亦 说 乎 ) -werds 

[学 而 "时 习 …' 之 不 亦 … "说 乎 9 

>>>snonlp.SnowNIP (x) .words 

5" 分词， 的 … "准确 度 ', ' 直 接 … 影响 "了 "后续 … "文本 … "处 理 ' 和 ',' 挖 据 ',' 算 法 ',' 的 ',' 最 
终 ', 哟 果 ','。'] 


7.9 汉字 到 拼音 的 转换 


Python 扩展 库 pypinyin 支持 汉字 到 拼音 的 转换 ,并 且 可 以 和 分 词 扩展 库 配 合 使 用 。 


i 人 1 ee 


>>>Jazy_pinyin('" 董 付 国 ') 绕 回 拼音 

['dong', 'fu', 'guo'] 

>>>lazy_pinyin(' 董 付 国 ',1) 朵 声调 的 拼音 

['@ng', 全 go5 7] 

>>>lazy_pinyin(' 董 付 国 ',2; 奶 一 种 拼音 形式 ,数字 表示 前 面 字母 的 声调 
[acBng' "fa 'guce'] 

>>>lazy_pinyin(' 董 付 国 ',3) 可 返回 拼音 首 字母 

[df ve"g9] 

>>>lazy_pinyin(' 重 要 ',1) 艇 够 根据 词组 智能 识别 多 音字 

L'apng', yo'] 

>>>lazy_pinyin(' 重 阳 ',1) 

[ch5ng" yang'] 

>>>pinyin(' 重 阳 ') 媒 回 拼音 

[['hing'], [yang7]] 

>>>pinyin(' 重 阳 节 ',heteronym True) 是 回 多 音字 的 所 有 读音 

[["zipng' ching' ‘tong'], ["Yang"], ("jig "','jis']] 

>>>import jieba 肉 实 不 需要 导入 jisba, 这 里 只 是 说 明 已 安装 
>>>x=' 中 英文 混合 test123' 

>>>lazy_pinyin (x) 相 动 调用 已 安装 的 jisba 扩 展 库 分 词 功 能 
[rzhong' "ying' ‘wen', hun', he', 'test123'] 

>>>lazy pinyin jisba.at (x)) 


[rzhong' "ying' wen', ‘hun', "he "test123"] 
>>>x=' 山 东 烟 台 的 大 樱桃 真 好 吃 啊 ， 
>>>scrted (x, key anbda h: lazy pinyin (on)) 
碗 拼音 对 汉字 进行 排序 
[ 啊 ', 吃 ',' 大 ',' 的 ',' 东 ,好 "山中 人 台 ', 桃 ',' 烟 ', 呆 ',' 真 1] 


7.10 ”精彩 案例 赏析 


示例 7-1 编写 函数 实现 字符 串 加 密 和 解密 ,循环 使 用 指定 密 钥 ,采用 简单 的 异 或 
算法 。 
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Gef crypt (source, key) : 
fram itertcols inport cycle 
result ="" 
te 一 ye (Key) 
for ch in source: 
result =result +chr (ord(Gh) ^ ord (next (tenp))) 
retum result 


Source ="'Shandong Institute of Business and Technoplogy" 
JEY 一 'Dong Fuguo'" 


Print ('Before Emcrypted: ' +Sscurce) 
‘encrypted =crypt (souroe, key) 

Print ('After Encrypted: ' +tencrypted) 
Secrypted =crypt (encrypted, key) 
Print ('After Decrypted: ' +decrypted) 


输出 结果 如 图 7-2 所 示 。 


Botors Enoryptadl Smiong Inatite of Duoigeoe md Treo 
After Encrypted:1eK D)~ Ug#-PT3 0, 1s/m -dp 上 
人 Popted: dandone notitute of gs nd Techtoloty 


于 
图 7-2 字符 串 加 密 与 解密 结果 


示例 7-2 编写 程序 ,生成 大 量 随机 信息 

本 例 代码 演示 了 如 何 使 用 Python 标准 库 random 来 生成 随机 数据 ,这 在 需要 获取 大 量 
数据 来 测试 或 演示 软件 功能 的 时 候 非常 有 用 ,不 仅 能 真实 展示 软件 的 功能 或 算法 ,还 可 以 
避免 泄露 真实 数据 引起 不 必要 的 争议 。 

fram randam jmport dhoice, randint 

inport string 

import codecs 





巾 用 汉字 Uniccce 编码 表 信 分 ) ,完整 列表 详 见 配套 源 代码 
StringPase =" \J7684 Na4e00 Na4e86 \L662£ \a6211 Na4e0dNu5728 Nadeba' 


def getmeil 0 : 
副 见 域名 后 级 ,可 以 随意 扩展 该 列表 
Suffix=[' .om', '.org', net an] 
characters =string.ascii letters +string.digits + ' 
Usemame ="' .join( (dhoice (haracters) for i in range (randint (6,12)))) 
dmain ="' .join((choice (characters) for i in range (randint (3,6)))) 
retim usememe +"@ ' +Gaain +choice (suffix) 


def getrelNp0 : 
retum '' .join( (str (randint (0,9)) for i in range (1))) 
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def getNemeornctiress (Dag) : 
""' 和 Dag 翌 表 示 返 回 随 机 姓名 ,fag 属 表 示 返 回 随机 地 址 '"'" 
if fHag=3: 
奈 部 分 中 国人 姓名 为 2~5 个 汉字 
rangestart, rangeend 2,5 
elif flag=*0: 
息 设 地 址 在 10 ~ 30 个 汉字 之 间 
Iangestart, rangeend 10,30 
result ="" .join( (dhoioe (Stringease) for i in range (randint (rangestart, rangeend) ))) 
retum result 


Gef getsex() : 
retum doice((' 男 ',' 女 ')) 


Gef getPoe 0 : 
Tetum str (randint (18,100)) 


GEf rain (filename) : 
with codecs.ahen (filename, 'w', rutf -8') as fp: 
fp.write ('Nene, Sex, pge, TelND, Actress, Erail \n') 
答 机 生成 200 个 人 的 信息 
for i in range (200): 
name =getNemeorncciress (1) 
Sex =getSex () 
a -gtnge() 
tel =getTelN2() 
actiress =getNemeOrnciress (0) 
email =cPtEreil () 
line =", ' .join ( [name, sexvaogevtelvactiress,erail]) +'\n' 
外 .write (line) 


GEf cutput (Filename) : 
with codecs.apen (filename, 'r', rutf -8') as fp: 
for line in fp: 
line Aine.split (',') 
for i in line: 
Print (i,end=", ') 
Print0) 





main (filenare) 
cutput (Fileneame) 
示例 7-3 检查 并 判断 密码 字符 串 的 安全 强度 。 
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inport string 


def heck (ou) : 
疗 码 必须 至 少 包含 6 个 字符 
证 not isinstance (wa str) or len (pd) <6: 


逆 码 强度 等 级 与 包含 字符 种 类 的 对 应 关系 

d={1: "weak',2: "below midile',3:"'above middle',4:'strong'} 

纷 别 用 来 标记 px 是否 含 有 数字 、 小 写字 母 .大 写字 母 和 指定 的 标点 符号 
r=[False] 吧 


for ch in pwd: 
婚 否 包含 数字 
if not r[0] and ch in string.digits: 
r[0] =True 
查 否 包含 小 写字 母 
elif not [1L] and ch in string.ascii lowercase: 
r[1] Tre 
查 否 包含 大 写字 母 
elif not r[2] and ch in string.ascii Uppercase: 
IC2] re 
担 否 包含 指定 的 标点 符号 
elif not [3] anq ch in ,173<>": 
r[3] -True 
统计 包含 的 字符 种 类 ,返回 密码 强度 
retim qd.get (r.oomt (True), 'error') 


Print (check ('a209, 0)) 
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正则 表达 式 是 字符 串 处 理 的 有 力 工 具 , 正 则 表达 式 使 用 预定 义 的 模式 去 匹配 一 类 具 
有 共同 特征 的 字符 串 ,可 以 快速 .准确 地 完成 复杂 的 查找 .替换 等 处 理 要 求 , 比 字符 串 自身 
提供 的 方法 提供 了 更 强大 的 处 理 功 能 。 例 如 ,使 用 字符 串 对 象 的 split( ) 方 法 只 能 指定 一 
个 分 隔 符 ,而 使 用 正则 表达 式 可 以 很 方便 地 指定 多 个 符号 作为 分 隔 符 ; 使 用 字符 串 对 象 的 
split( ) 并 指定 分 隔 符 时 ,很 难处 理 分 隔 符 连续 多 次 出 现 的 情况 ,而 正则 表达 式 让 这 一 切 都 
变 得 非常 轻松 。 





8.1 正则 表达 式 语 法 


811 正则 表达 式 基本 语法 
正则 表达 式 由 元 字符 及 其 不 同 组 合 来 构成 ,通过 巧妙 地 构造 正则 表达 式 可 以 匹配 任 
意 字符 串 ,完成 查找 替换 等 复杂 的 字符 串 处 理 任 务 。 常 用 的 正则 表达 式 元 字符 如 表 8-1 
所 示 。 
表 8-1 正则 表达 式 常用 元 字符 


























元 字符 功能 说 明 
匹配 除 换行 符 以 外 的 任意 单个 字符 
时 匹配 位 于 * 之 前 的 字符 或 子 模式 的 0 次 或 多 次 出 现 
+ 匹配 位 于 + 之 前 的 字符 或 子 模式 的 1 次 或 多 次 出 现 
澡 在 [ ] 之 内 用 来 表示 范围 
1 匹配 位 于 1 之 前 或 之 后 的 字符 
匹配 以 ^ 后 面 的 字符 或 模式 开头 的 字符 串 
$ 匹配 以 $ 前 面 的 字符 或 模式 结束 的 字符 串 
匹配 位 于 “?" 之 前 的 0 个 或 1 个 字符 或 子 模式 , 即 问号 之 前 的 字符 或 子 模式 是 可 选 的 。 
紧 随 任何 其 他 限定 符 ( * 、+ 、 ?inl in,|、in,ml) 之 后 时 ,表示 "* 非 贪心 "匹配 模式 。 
“ 非 贪心 "模式 匹配 尽 可 能 短 的 字符 串 ,而 默认 的 “贪心 "模式 匹配 尽 可 能 长 的 字符 串 。 
例如 ,在 字符 串 "oooo" 中 ,“o+?" 只 匹配 单个 o, 而 o+ 匹配 所 有 o 
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续 表 
元 字符 功能 说 明 
\ 表示 位 于 \ 之 后 的 为 转 义 字符 
a 此 处 的 num 是 一 个 正 整 数 , 表 示 前 面 字符 或 子 模式 的 编号 。 例 如 ,“(.)\1” 匹 配 两 个 连 
续 的 相同 字符 
¥f 匹配 一 个 换 页 符 
\n 匹配 一 个 换行 符 
\r 匹配 一 个 回 车 符 
\b 匹配 单词 头 或 单词 尾 
\B 与 \b 含义 相反 
\d 匹配 任何 数字 ,相当 于 [0-9] 
\D 与 \d 含义 相反 ,相当 于 [ ^0-9] 
\s 匹配 任何 空白 字符 ,包括 空格 , 制 表 符 . 换 页 符 ,与 [ \f\n\r\t\v] 等 效 
\S 与 \s 含义 相反 
\w 匹配 任何 字母 数字 以 及 下 夯 线 ,相当 于 [a-zA-Z0-9_] 
\W 与 \w 含义 相反 ,与 [^A-Za-z0-9_] 等 效 
() 将 位 于 () 内 的 内 容 作 为 一 个 整体 来 对 待 
和 按 | 1 中 指定 的 次 数 进行 匹配 ,例如 ,13 ,81| 表 示 前 面 的 字符 或 模式 至 少 重复 3 次 而 最 多 
重复 8 次 
[] 匹配 位 于 [ ] 中 的 任意 一 个 字符 
[xyz] ^ 放 在 [ ] 内 表示 反 向 字符 集 ,匹配 除 x、y,z 之 外 的 任何 字符 
[a-z] 字符 范围 ,匹配 指定 范围 内 的 任何 字符 
[“^a-z] 反 向 范围 字符 ,匹配 除 小 写 英文 字母 之 外 的 任何 字符 


如 果 以 \ 开 头 的 元 字符 与 转 义 字符 相同 , 则 需要 使 用 \\ ,或 者 使 用 原始 字符 串 。 在 字 
符 串 前 加 上 字符 r 或 R 之 后 表示 原始 字符 串 ,字符 串 中 任意 字符 都 不 再 进行 转 义 。 原 始 
字符 串 可 以 减少 用 户 的 输入 ,主要 用 于 正则 表达 式 和 文件 路 径 字符 串 的 情况 ,但 如 果 字 符 
串 以 一 个 斜 线 \ 结 束 , 则 需要 多 写 一 个 斜 线 , 即 以 \ 结 束 。 


812 正则 表达 式 扩展 语法 


E 则 表达 式 使 用 圆 括号 ”( ) "表示 一 个 子 模式 , 圆 括号 内 的 内 容 作为 一 个 整体 对 待 ， 
例如 ,"(red) + 可 以 匹配 redred'\redredred' 等 一 个 或 多 个 重复 red' 的 情况 。 使 用 子 模式 扩 
展 语法 可 以 实现 更 加 复杂 的 字符 串 处 理 功能 ,常用 的 扩展 语法 如 表 8-2 所 示 。 
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表 8-2 ”常用 子 模式 扩展 语法 
语 法 功能 说 明 
(?P < groupname > ) 为 子 模式 命名 
(Way 设置 匹配 标志 ,可 以 是 几 个 字母 的 组 合 , 每 个 字母 含义 与 编译 标志 相同 
(023 匹配 但 不 捕获 该 匹配 的 子 表达 式 
(IP = groupname) 表示 在 此 之 前 的 命名 为 groupname 的 子 模式 
(3#…) 表示 注释 
Pe 用 于 正则 表达 式 之 前 ,如 果 < = 后 的 内 容 在 字符 串 中 出 现 则 匹配 ,但 不 返 
es 回 < = 之 后 的 内 容 
人 用 于 正则 表达 式 之 后 ,如 果 = 后 的 内 容 在 字符 串 中 出 现 则 匹配 ,但 不 返回 
= 之 后 的 内 容 
i 用 于 正则 表达 式 之 前 ,如 果 < ! 后 的 内 容 在 字符 串 中 不 出 现 则 匹配 ,但 不 
返回 < ! 之 后 的 内 容 
np 用 于 正则 表达 式 之 后 ,如 果 ! 后 的 内 容 在 字符 串 中 不 出 现 则 匹配 ,但 不 返 
ER 回 ! 之 后 的 内 容 
813 正则 表达 式 锦 集 


正则 表达 式 语法 博大 精深 ,很 难 一 下 子 全 都 记 住 ,建议 在 了 解 基 本 语法 的 基础 上 , 记 


住 一 些 常用 的 写法 ,然后 在 实际 应 用 中 不 断 深入 。 


http : 


符 串 


(1) 最 简单 的 正则 表达 式 是 普通 字符 串 ,只 能 匹配 自身 。 

(2) 'pje]ython' 可 以 匹配 python' jython'" ceython'。 

(3) [a-zA-Z0-9]' 可 以 匹配 一 个 任意 大 小 写字 母 或 数字 。 

(4) ' abce]" 可 以 匹配 一 个 任意 除 a be 之 外 的 字符 。 

(5) 'python1perl 或 p(ythonler) 都 可 以 匹配 python' 或 per'。 

(6) r'(Chttp:M[)? (www\. )? python \. org' 只 能 匹配 'http://www. python. org'、 
//python. org' www-. python. org'Fl'python. org'。 

(7) “http' 只 能 匹配 所 有 以 http' 开 头 的 字符 串 。 

(8) (pattern) * : 允许 模式 重复 0 次 或 多 次 。 

(9) (pattern) + : 允许 模式 重复 一 次 或 多 次 。 

(10) (pattern) | m,n| : 允许 模式 重复 m ~n 次 ,注意 逗号 后 面 不 要 有 空格 。 

(11) (alb) * ce'; 匹配 多 个 (包含 0 个 )a 或 b, 后 面 紧 跟 一 个 字母 c。 

(12) ab|1,1': 等 价 于 'ab + ', 匹 配 以 字母 a 开头 后 面 紧 跟 一 个 或 多 个 字母 b 的 字 


(13) "“[a-zA-Z] 111([a-zA-Z0-9._] )14,19| $': 匹配 长 度 为 5 ~20 的 字符 串 ,必须 


以 字母 开头 并 且 后 面 可 带 数字 字母“_”“. “的 字符 串 。 


(14)“(\w) 16,201 $': 匹配 长 度 为 6~20 的 字符 串 ,可 以 包含 字母 数字、 下 画 线 。 
(15) "di1,34\. \di1,3F\. dll,31- \d11,31$': 检查 给 定 字符 串 是 否 为 合法 下 
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地 址 。 

(16) "(13[4-9]\di81)1(15[01289]\d|8|)$': 检查 给 定 字符 串 是 否 为 移动 导 
号 码 。 

(17)"“[a-zA-Z] + $': 检查 给 定 字 符 串 是 否 只 包含 英文 大 小 写字 母 。 

(18) "w+@(\w+\.)+\w+ 和 $': 检查 给 定 字 符 串 是 否 为 合法 电子 邮件 地 址 。 

(19)"“(\-)?\d +(\. \d11,2|)?$'; 检查 给 定 字 符 串 是 否 为 最 多 带 有 2 位 小 数 的 正 
数 或 负数 。 

(20) [ \u4e00-\u9fa5 ]': 匹配 给 定 字符 串 中 的 常用 汉字 。 

(21) "\d11811\d1151 $': 检查 给 定 字 符 串 是 否 为 合法 身份 证 格式 。 

(22) \dj41-\d1i1,21-\d11,214': 匹配 指定 格式 的 日 期 ,例如 2017-3-30。 

(23) "(7?=. *[a-z])(?=. *[A-Z])(?=. * \d)(?=. 并 ,_]).18,| 4': 检查 给 
定 字符 串 是 否 为 强 密 码 ,必须 同时 包含 英语 字母 大 写字 母 .英文 小 写字 母 ,数字 或 特殊 符 
号 (如 英文 逗号 .英文 句号 .下 画 线 ) ,并 且 长 度 必须 至 少 8 位 。 

(24) "(?!. 并 "Vi =%?]). +": 如 果 给 定 字符 串 中 包含 " A、;、= 、% 和“?” 则 
匹配 失败 ,关于 子 模式 语法 请 参考 表 54。 

(25)(.)\\1+'; 匹配 任意 字符 或 模式 的 一 次 或 多 次 重复 出 现 。 

(26) ((?P<f>\b\w + \b)\s+(?P=f))': 匹配 连续 出 现 两 次 的 单词 。 

(27) ((?P<f>.)(?P=f)(?P<g>.)(?P=g))': 匹配 AABB 形式 的 成 语 或 字母 
组 合 。 

使 用 时 要 注意 的 是 ,正则 表达 式 只 是 进行 形式 上 的 检查 ,并 不 保证 内 容 一 定 正确 。 例 
如 上 面 的 例子 中 ,正则 表达 式 “\dl1,31\.\dll,31\.\dll,3.\dll.3}$ 可 以 检查 字符 
串 是 否 为 IP 地 址 ,字符 串 888. 888. 888. 888' 这 样 的 也 能 通过 检查 ,但 实际 上 并 不 是 有 效 的 
IP 地 址 。 同 样 的 道理 ,正则 表达 式 "\dll8l1l\dl151 $' 也 只 负责 检查 字符 串 是 否 为 18 位 
或 15 位 数字 ,并 不 保证 一 定 是 合法 的 身份 证 号 。 


8.2 直接 使 用 正则 表达 式 模 块 re 处 理 字 符 串 


Python 标准 库 re 提供 了 正则 表达 式 操作 所 需要 的 功能 , 既 可 以 直接 使 用 re 模块 中 的 
方法 ( 见 表 8-3 ) 处 理 字符 串 ,也 可 以 把 模式 编译 成 正则 表达 式 对 象 再 使 用 ( 见 8.3 节 ) 。 
表 8-3 re 模块 中 的 方法 


出 
EE 




















方 法 功能 说 明 
compile( pattern[ , flags] ) 创建 模式 对 象 
escape( string) 将 字符 串 中 所 有 特殊 正则 表达 式 字符 转 义 
findall( pattern ，string[ , flags] ) 列 出 字符 串 中 模式 的 所 有 匹配 项 
全 eo match 
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方 法 


功能 说 明 





fullmatch( pattern, string, flags =0) 


尝试 把 模式 作用 于 整个 字符 串 ,返回 match 对 象 或 None 





match( pattem, string[ , flags] ) 


从 字符 串 的 开始 处 匹配 模式 ,返回 match 对 象 或 None 











purge( ) 清空 正则 表达 式 缓 存 
search( pattern, string[ , flags] ) 在 整个 字符 串 中 寻找 模式 ,返回 match 对 象 或 None 
split( pattern ，string[ , maxsplit =0] ) “| 根据 模式 匹配 项 分 隔 字符 串 





sub( pat, repl, string[ , count =0]) 


将 字符 串 中 所 有 pat 的 匹配 项 用 repl 蔡 换 ,返回 新 字符 串 ,repl 
可 以 是 字符 串 或 返回 字符 串 的 可 调用 对 象 ,该 可 调用 对 象 作 
用 于 每 个 匹配 的 match 对 象 





subn( pat, repl, string[ , count =0]) 





将 字符 串 中 所 有 pat 的 匹配 项 用 repl 替换 ,返回 包含 新 字符 串 
和 蔡 换 次 数 的 二 元 组 ,repl 可 以 是 字符 串 或 返回 字符 串 的 可 
调用 对 象 , 该 可 调用 对 象 作 用 于 每 个 匹配 的 match 对 象 


其 中 函数 参数 flags 的 值 可 以 是 re. 工 注意 是 大 写字 母 I 不 是 数字 1 ,表示 忽略 大 小 


写 ) .re.L( 支 持 本 地 字符 集 的 字符 ) re. M( 多 行 匹 配 模式 ) \re. S( 使 元 字符 *. 





匹配 任意 


字符 ,包括 换行 符 ) .re. U( 匹配 Unicode 字符 ) .re. X( 忽略 模式 中 的 空格 ,并 可 以 使 用 # 注 


释 ) 的 不 同 组 合 ( 使 用 | 进行 组 合 ) 。 


下 面 的 代码 演示 了 直接 使 用 re 模块 中 的 方法 和 正则 表达 式 处 理 字符 串 的 用 法 ,其 中 
match( ) 函数 用 于 在 字符 串 开始 位 置 进 行 匹配 ,而 search( ) 函数 用 于 在 整个 字符 串 中 进行 
匹配 ,这 两 个 郴 数 如 果 匹 配 成 功 则 返回 match 对 象 ,否则 返回 None。 


>>>import re 本 和 re 模块 
>>>text ='alfha. beta'…gamma delta' 抽 试 用 的 字符 串 
>>>re.split('[\. ] +',text) 桔 用 指定 字符 作为 分 隔 符 进行 分 隔 
['alpha', ‘beta', "gamma'v 'delta'] 

>>>re.split ('[\. ] +',text,mexsplit 2) 报 多 分 隔 2 次 
['alpha', beta', 'germa delta'] 

>>>re.split('[\. ] +',text,mexsplit 3) 报 多 分 隔 1 次 
L'alpha', "beta…germa celta'] 

>>>pat ="' [a -2A-2] + 

>>>re.findall (pat, text) 得 找 所 有 单词 
[alFha' "beta' "gamma' "delta'] 

>>>pat =" {nare}' 

>>>text ='Dear {name}…" 

>>>re-sub (pat, Mr.Dong' ,text) 症 符 串 蔡 换 
DearMr.Dang-， 

>>>s='asd" 

>>>re.sib('alsld', 'good',s) 缔 符 串 蔡 换 


"good gpod good' 


>>>s ="It's a very good gpod igea™" 
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>>>re.sib(r' (PWH) Ur'U',s) 处 理 连续 的 重复 单词 
"It's a very good iceam 
>>>re.ab('a', lanbda x:x.grop (0) -UEPer (), 'asa abc abde') 


epl 为 可 调用 对 象 
"ea pc mcey 
>>>re.sub(" [a -z] "',lanbda x:x.grop (0) .UPer (0) "aaa abc sbce') 
"AAA PEC PE 
>>>re.suib(' [a -2A -2] ', lanbda x:dhr (ord (x.grop (0) ) "32), 'asa aBc abde') 
获 文 字母 大 小 写 互 换 
Rn Pbc PE 
>>>re.sin('a', 'dfg', 'aaa abc abde') 是 回 新 字符 串 和 替换 次 数 
(atfgnifenifg afgbc dfgbae'y5) 
>>>re.sib('a', 'dfg', 'asa abc abde') 
"aferitgnitg dfgbc dfgode' 
>>>re.escape ('http://www.python.org') 证 符 串 转 义 
"mhtbp\\:\VNAVwwwNN\Eython\\arg' 
>>>print (re .match ('done Ilqnit' 'done')) 拒 配 成 功 ,返回 match 对 象 
< _sre.SFE Match cbject at 0x00BI2178 > 
>>>print (re.matah('dne lgait' ‘dane!')) 拒 配 成 功 
< _sre.SFE Match cbject at Ox00RI2128 > 
>>>print (ematch('done Ilqait' 'dpe!')) 柜 配 不 成 功 , 返 回 空 值 Nne 
NEne 
>>>Print (re-natch (done lgqait 'd!iane!')) 扰 配 不 成 功 
NEne 


>>>print (re.search('cone lgqait 'd!iqne!done')) 折 配 成 功 
<_sre.SFE Match cbject at 0x0000000002D03D98 > 


下 面 的 代码 使 用 不 同 的 方法 删除 字符 串 中 多 余 的 空格 ,如 果 遇 到 连续 多 个 空格 则 只 
保留 一 个 ,同时 删除 字符 串 两 侧 的 所 有 空白 字符 。 


>>>inport re 

>>>s ='asa bb cde ff 

>>>' '.join(s.split()) 奸 接 使 用 字符 串 对 象 的 方法 

"aaa bb c de fff' 

>>>' '.join(re.split ('[\s] +',s.strip0))) 后 时 使 用 re 模块 中 的 函数 和 字符 串 对 象 的 方法 
"aaa Hb c de fff' 

>>>' '.join(re.split('\s+"',s.strip0)) 想 上 一 行 代码 等 价 

"aaa Hb c de fff' 

>>>re-sib(\s+ ',s.strip()) 年 接 使 用 re 模块 的 字符 串 蔡 换 方法 

"aaa Hb c de fff' 


下 面 的 代码 使 用 几 种 不 同 的 方法 来 删除 字符 串 中 指定 的 内 容 : 


>>>enail —"tony@ tiremove thisger.net”" 
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>>>m=re-search ("rerpve this",erail) 
>>>enail [:m.start 0] +enrail mena03:] 
>>>re-aib(rerove this verail) 
>>>erail .replace (rremove this 0) 


车 用 search0 方 法 返回 的 match 对 象 
疗 符 串 切 片 


利 接 使 用 re 模块 的 sajb0 方 法 


利 接 使 用 字符 串 蔡 换 方 法 


下 面 的 代码 使 用 以 \ 开 头 的 元 字符 来 实现 字符 串 的 特定 搜索 。 


>>>inport re 


>>>exanple ='Beautiful is better than ugly.' 


>>>re.fincall (' \\Hb. +?\\b',eanple) 


[ "better'] 

>>>re.findall (' \\Hb. +\\b',exanple) 
['better than ugly'] 

>>>re.fincall (' \\HP\W* \\b',exanple) 

[ "better'] 

>>>re.fincall (' \\Eh. +?\\b',exanple) 
["'han'] 

>>>re.fincall (' \\b\W. +?\\b',exanple) 
['Beautiful', 'is', "better', "than' "ugly'] 
>>>re.findall (' \w +',exanple) 
['Beautiful', 'is', ‘better', "than', "ugly'] 
>>>re.findall (r' \b\W. +?\b',exanple) 
["'Beautifil ', "is "better', ‘than', "ugly'] 
>>>re.split (' \s',exanple) 


["Beautifa' 'is', "better', "than', "ugly.'] 


扣 字 母 b 开 头 的 完整 单词 
紫 处 问号 "表示 非 贪心 模式 


人 痊 心 模式 的 匹配 结果 


杯 以 h 开 头 且 含有 hh 字母 的 单词 剩余 部 分 
新 有 单词 

新 有 单词 

柄 用 原始 字符 串 


柄 用 任何 空白 字符 分 隔 字符 串 


>>>re.finall('\d+\. d+\. d+', "Python 2.7.13') 


['2.7.13'] 


得 找 并 返回 x.x.x 形 式 的 数字 


>>>re.fincall ('\d+\.\d+\. \d+', "Python 2.7.13,Python 3.6.0') 


['2.7.13','3.6.0'] 


>>>s =" <html > <head >This is head. </head > <body >This is body. </body ></ht > 
>>>pattem 一 ' <ht > <head >(. +) </head > <body >(. +H) </body> </html > 


>>>result =re.seardh (pattem, s) 
>>>result .grop (1) 

"This is head.' 

>>>result .grop 人 2) 

"This is body." 


第 一 个 子 模 式 


第 二 个 子 模式 


8.3 使 用 正则 表达 式 对 象 处理 字 符 串 


虽然 直接 使 用 re 模块 也 可 以 使 用 正则 表达 式 处 理 字符 串 ,但 是 正则 表达 式 对 象 提供 
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了 更 多 的 功能 。 使 用 编译 后 的 正则 表达 式 对 象 不 仅 可 以 提高 字符 串 的 处 理 速度 ,还 提供 
了 更 加 强大 的 字符 串 处 理 功能 。 首 先 使 用 re 模块 的 compile( ) 方 法 将 正则 表达 式 编译 成 
正则 表达 式 对 象 ,然后 再 使 用 正则 表达 式 对 象 提供 的 方法 进行 字符 串 处 理 。 


1. match( ) .search( ) .findall( ) 


正则 表达 式 对 象 的 match( string[ ,pos[ ,endpos] ] ) 方 法 在 字符 串 开 头 或 指定 位 置 进 
行 搜索 ,模式 必须 出 现在 字符 串 开头 或 指定 位 置 ;search( string[ , pos[ ,endpos] ] ) 方 法 在 
整个 字符 串 或 指定 范围 中 进行 搜索 ;findall( string[ ,pos[ ， endpos ] ] ) 方法 字符 串 中 查找 
所 有 符合 正则 表达 式 的 字符 串 并 以 列表 形式 返回 。 


>>>inport re 

>>>exanple ='shanpong Institute of Business and Technology'" 

>>>pattem =e-cmpile(r' NBNw+Vb) 查找 以 妃 开 头 的 单词 
>>>pattem.fincall (eaenple) 楼 用 正则 表达 式 对 象 的 二 ncall (方法 
['Business'] 

>>>pattem =re.onpile(r' \Ww+g\b') 慎 找 以 字母 g 结 尾 的 单词 
>>>pattem.findall (exanple) 

['shanpong'] 

>>>Eattem =re.onpile(r' bla -2A-2]{3}\b') 得 找 3 个 字母 长 的 单词 
>>>Pattem.findall (exanple) 

['and'] 

>>>pattem.matdh (exarple) 类 字符 串 开头 开始 匹配 ,失败 返回 空 值 
>>>pattem.search (exanple) 症 整 个 字符 串 中 搜索 ,成功 
<_sre.SFEE Match doject; span=(31,34) ,match='anq' > 

>>>Fattbem =re.copile (Fr' \b\W* a\Ww* \b') 得 找 所 有 含有 字母 a 的 单词 
>>>Fattem.findall (exanple) 

['shanpong"', "and'] 

>>>text —"He was carefully disquised but capbured quickly by police." 

>>>re.fincall (r" \w +1y", text) 得 找 所 有 以 字母 组 合 ly 结尾 的 单词 


["carefmly' "qunickay'"] 


2. sub( ) .subn() 





正则 表达 式 对 象 的 sub(repl, string[ .count =0]) 和 subn(repl， string[ ,count =0]) 
方法 用 来 实现 字符 串 替换 功能 ,其 中 参数 repl 可 以 为 字符 串 或 返回 字符 串 的 可 调用 对 象 。 


>>>exenple ="' "Beautifil is better than ugly. 
Eplicit is better than implicit. 

Sirple is better than omplex. 

Cmplex is better than omplicated. 

Flat is better than nested. 

Sparse is better than dense. 

Feacability oants.""" 
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>>>pattem =re.onpile(r' \HD\W* \b',re.I) 碟 配 以 b 或 B 开 头 的 单词 
>>>print (pattem.sb(' * ',exnple)) 将 符合 条 件 的 单词 替换 为 * 
* is* than ugly. 
Eplicit is* than irmplicit. 
Sinple is* than omplex. 
Omplex is* than oplicated. 
Flat is* than nested. 
Sparse is* than dense. 
Feacebility conts. 
>>>print (pattem.sib (lanbda x: x.grop (0) .-UEPer () ,eanple)) 
到 所 有 匹配 项 都 改 为 大 写 
FEAUTIEUL is EETIER than ugly. 
Explicit is EETIER than implicit. 
Sinple is EETIER than omplex. 
Flat is EETIER than nested. 
Sparse is EETIER than dense. 
Feacebility conts. 
>>>print (pattem.sib(' * ',exanple,1)) 惧 蔡 换 一 次 
* is better than ugly. 
Eplicit is better than implicit. 
Sinple is better than ormplex. 
Flat is better than nested. 
Sparse is better than dense. 
Feacebility oonts. 
>>>pattem =re.onpile(r' \Hp\Ww* \b') 柜 配 以 字母 p 开 头 的 单词 
>>>print (pattem.sib(' * ',exanple,1)) 将 符合 条 件 的 单词 替换 为 * 
如 替换 一 次 
Peautifil is* than ugly. 
Explicit is better than implicit. 
Sinple is better than ormplex. 
Flat is better than nested. 
Sparse is better than dense. 
Feadebility conts. 


3. split( ) 
正则 表达 式 对 象 的 split( string[ ， maxsplit =0] ) 方 法 用 来 实现 字符 串 分 隔 。 


>>>esenple 一 'aneyvtwothree.four/five\six?seven[eight]nine |ten' 
>>>pattem 一 e-cmpiletr'0 -人 XDA 糙 定 多 个 可 能 的 分 隔 符 
>>>pattem.split (esenple) 

[Tane' ‘bp', ‘three', ‘four', 'five', 'six', 'seven', 'eight', nine', "ten'] 
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>>>exanple 一 'aneltwcPthree3fcoar4five5sijx6seven7eightBnineeten" 
>>>Eattem =re.orpile(r'\d+') 硅 用 数字 作为 分 隔 符 
>>>pattem.split (exenple) 

[Tane' "bwp' ‘three', 'four', 'five', 'six', 'seven', 'eight', nine', "ten'] 
>>>exanple 一 'cne to three four, five.six.seven,eight,nineten' 
>>>Fattem =re.ompile(r'[\s,.\G] +") 网 许 分 隔 符 重复 
>>>pattem.split exenple) 

[rane' ‘bp', three', ‘four', 'five', 'six', 'seven', eight' ninev "ten'] 


8.4 ” match 对象 


正则 表达 式 模块 或 正则 表达 式 对 象 的 match( ) 方 法 和 search( ) 方 法 匹配 成 功 后 都 会 


返回 match 对 象 。match 对 象 的 主要 方法 有 group() (返回 匹配 的 一 个 或 多 个 子 模式 内 
容 ) groups() (返回 一 个 包含 匹配 的 所 有 子 模式 内 容 的 元 组 ) ,groupdict( ) (返回 包含 匹配 
的 所 有 命名 子 模式 内 容 的 字典 ) ,start( ) (返回 指定 子 模式 内 容 的 起 始 位置 ) end( ) (返回 
指定 子 模式 内 容 的 结束 位 置 的 前 一 个 位 置 ) span( ) (返回 一 个 包含 指定 子 模式 内 容 起 始 


位 置 和 结束 位 置 前 一 个 位 置 的 元 组 ) 等 。 
下 面 的 代码 演示 了 match 对 象 的 group( ) groups( ) 与 groupdict( ) 以 及 其 他 方法 的 
用 法 : 


>>>m=rematchtr"(Ww-H (WH)", "Tsaac Newton, physicist") 

>>>m.group (0) 版 回 整 个 模式 内 容 

"Tsaac Newtion' 

>>>m.grop 0) 是 回 第 一 个 子 模式 内 容 
Pe 

>>>m.grop Ce) 媒 回 第 二 个 子 模式 内 容 
Newtban' 

>>>m.grop (1,2) 是 回 指定 的 多 个 子 模式 内 容 


(Isaac Newtion') 
下 面 的 代码 演示 了 子 模式 扩展 语法 的 用 法 : 


>>>m=re-match (r" (?P <first nane >\w +) (2?P <last_ name >\W +H)", "Maloolm Reynolds") 
>>>m.group('first nane') 楼 用 命名 的 子 模式 

"Maloolm' 

>>>m.grop ("last nane') 

"FEewnplas' 

>>>m=remath(r" (dH \. (dH","24.1632") 

>>>m.grops() 蝗 回 所 有 匹配 的 子 模式 (下 包括 第 0 个 ) 
(245 "1632') 

>>>m=re-match (r" (2P <first_ name >\W +) (3?P <last_ name >\wH "Maloolm Reynolds") 
>>>m.gropdict () 各 字典 形式 返回 匹配 的 结果 

{"first name': Maloolm', 'last neme': ‘Feynolds'} 

>>>exenplestring ="' "There should be cne - -and prefersbly cnly cne 一 -Gbvicus way to db it. 
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Although that way may not be abvicus at first unless you're Dutah. 
Now js better than never. 
Although never is often better than right now.'"" 
>>>pattem =re.onpile(r' (2<=\W\s)never (?=\s\W) ') 
得 找 不 在 句子 开头 和 结尾 的 never 
>>>matchFesult =pattem.search (exenplestring) 
>>>rretdPesult .span() 
(172,177) 
>>>Fattem =re.onpile(r' (2?<=\W\s)never') 
查找 位 于 句子 未 尾 的 单词 
>>>ratchFesmlt -attem.ssarch (exanpleString) 
>>>AraetdiPesult .span() 
(156,161) 
>>>Fattem =re.ompile(r' (?:is\s)better (\sthan) ') 
查找 前 面 是 is 的 better than 组 合 
>>>ratchFesumt =pattem.search (exanpleString) 
>>>mratdFesult.span() 
(141,155) 
>>>matchResult.group (0) 租 0 表示 整个 模式 
"is better than' 
>>>mratdResult .grop (1) 
“tian 
>>>pattem =re.ompile(r' \b(?i)n\Ww+\b') 
收 找 以 n 或 昌 字 母 开 头 的 所 有 单词 
>>>incex -0 
>>>wihile True: 
metchResut =pattem.seardh (exanpleString, index) 
if not ratchResult: 
break 
Print tatdFesult .grop (0), ':',matdResult .span(0)) 
index -atchResult .end (0) 
Dot : (92,95) 
NEw : (137,140) 
never : (156,161) 
never : (172,177) 
Dow : (205,208) 
>>>Fattem =re.oqpile(r' (? <!not \s)be\pb') 查找 前 面 没有 单词 nct 的 单词 be 
>>>incex =0 
>>>winjile True: 
matchFesult -pattem. search (exenplestring index) 
if not matchResult: 
break 
Print tatdResult .grop (0) , ':',mat dhesult .span (0)) 
index reat dResult .end (0) 
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a 
be : (3,15) 
>>>exenpleSstring[13:20] 租 证 一 下 结果 是 否 正确 
Wi 
>>>pattem =re.omnpile(r'(\bW* (P<E>WH (PH) Ww* \b)') 
缸 配 有 连续 相同 字母 的 单词 
>>>incex=0 


>>>while True: 
mat dFesult =pattem.search (exanpleString, index) 
if not matchResult: 
break 
Print tratchFesult .grop (0) , ':',mat dResult .grop 2)) 
index matdResult.end(0) 1 
unless : S 
better : 七 
better : 七 
>>>5 一 'aabc abod sripcq abccq sbcoa' 
>>>p=re.onpile(r' (\p\W* (?P<E>WwH (PT) \W* \p) ') 
>>>p.fincdall (s) 
[('asbc', 'a'), (‘atbod', 'b'), ('abood', 'c'), ('abocd', 'd')] 


8.5 精彩 案例 赏析 


示例 8-1 使 用 正则 表达 式 提取 字符 串 中 的 电话 号 码 。 
inrport re 


telNnber ="' ''Suppose my Fhone ND. js 0535 -1234567, 
Ycurs is 010 -12345678, 
his is 025 -87654321.'"" 
Fattem =re.ompile(r' (\d{3,4})) -(\d{7,8)D) ") 杜 意 ,逗号 后 面 不 能 有 空格 
index =0 
while True: 
matchFesult =pattem. search (telNnibber, index) 类 指定 位 置 开 始 匹 配 
if not ratchpesult: 
break 
Print (' —' * 30) 
Print ('Suooess:') 
for i in range G) : 
Print ('Searched content: ',matcdResult .grop (i), \ 
' Start fram: ',matdpPesult.start (1), 'End at:',matdPesult .end(i), \ 
' Its span is:',matdpesult.span(i)) 
index "atchResult .end ©) 些 定 下 次 匹配 的 开始 位 置 


示例 8-2 使 用 正则 表达 式 提取 Python 程序 中 的 类 名 、 函 数 名 以 及 变量 名 等 标识 符 。 
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将 下 面 的 代码 保存 为 FindIdentifiersFromPyFile. py, 在 命令 提示 符 环境 中 使 用 命令 
“Python FindIdentifiersFromPyFile. py 目标 文件 名 ”查找 并 输出 目标 文件 中 的 标识 符 。 


classes ={} 
functions =[] 
variables ={ "nomal ' :{}, Parameter' :{}, "infor':{}} 


This is a test string: 
atest,btest =3,5 


Gef _icentifyclassNemes (index, line) : 
"' parameter index is the line nmber of line, 
Pearameter line js a line of oode of the file to check' 
Fattem =re.ompile(r' (?<=class\s) W+(?=.* ?:)') 
matchResult =pattem.seardh (line) 
if not ratchResult: 
retim 
ClassNemre "atchResult .group (0) 
classes [classNeme] =classes.get (classNare, []) 
Classes [classNane] .atpend (index) 


GEf _icentifyFuncticnNanes (indes, line) : 
Pattem =re.ompile(r'(?<=0ef\s) (WH \((.* 3N(2 一 :) 
metchFesult =pattem.seardh (line) 
if not retchFesult: 
rebm 
finctiorNamre satiresult .group (1) 
finctions.append( (fnctiarNane, index)) 
Ferareters etchResult .grop 2) .split (r',') 
if parameters[0] ==""': 
rebim 
for v in parameters: 
Variables['parameter'] [v] varisbles['parameter'] .get (v, []) 
variables[ parameter'] [v] .arpend (incdex) 


Cef icdentifyWariableNames (index, Line) : 
{ind nomal variables, including the case: a,p 3,5 
Fattem re.ompile(r' \b(.* 3) (2=\s3') 
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matchFesult pattem.search (line) 
if matchResult: 
VS atdPFesut.gropd) .split(r',') 
for v in vs: 
onsider the case 'if variable==—value' 
i£f 'i£f ' inv: 
vy.spLlit() [L] 
onsider the case: 'a[3] 3" 





index (' [')] 
Variables['nomal'] [v] —ariables['nonmral'] .get (v, []) 
variables[ 'nomal'] [v] .append (index) 
Fattem =re.ompile(r' (2<=for\s) (.* ?) (?=\sin) ') 
mtdhResult =pattem.sesardh (line) 
if matchResult: 
VS atdResut.grop ld) .split (r',') 
for v in vs: 
Variables[ "infor'] [v] ariables["infor'] .gat (v, []) 
variables[ "infor'] [v] .append (index) 


Gef utput 0): 
Print (' =" * 30) 
Print ('The class names and their line nibers are:') 
for key,value in classes.items () : 
Print (key, ': ',value) 
Print (' =" * 30) 
Print ('The foncticn neres and their line mibers are:') 
for i in foncticns: 
Print (i[0],':",i0]) 
Print (' =" * 30) 
Print ("The nomral variable names and their line nmibers are:') 
for key,valve in variables['nomal'] .items(): 
Print (ey, ': ',value) 
Print (' 一 * 20) 
Print ("The Parameter names and their line nmbers in fncticns are:') 
for key,valye in variables['parameter'] .items (): 
Print (ey, ': ',value) 
Print (' 一 * 20) 
Frint ("Ihe variable names and their line nmbers in for statements are:') 
for key,valye in variables["infor'] .items(): 
Print (ey, ': ',value) 


刀 EPose the lines of cments less than 50 
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Gef comments (index) : 
for i in range 50) : 
line -alltines [index Hi]-strip0 
证 line.endewith('™™"") or line.endswith(™'''"): 


TEtum 本 
if_ nme _ = 一 min _": 
fileNeme =sys.argv [1] 疹 令 行 参数 


if not os.path.isfile (fileNeame) : 
print (Your irput is not a file.') 
sys.exit 0) 垦 出 当前 程序 
if not fileNeme.encewith('-py9): 
Print ('sorry. I can cnly check Python source file.') 
Sys.exit (0) 
allLines =[] 
with cpen (fFileNane, 'r') as fp: 
allLines =fp.readlines () 
index =0 
totalIen =len (allLines) 
while index <totallen: 
line eallLines [index] 
ttrip the blank characters at both end of line 
line Aine.strip() 
nore the oments starting with '#¥ 
if line.startswith('#): 
index + 本 
contimue 
攻 gnore the coments between ''' or ™™ 
if line.startswith('™"') or ]ine.startswith(" 
index +=oments (index) 
contimue 
_identifyClassNenes (index 1, line) 
_icdentifyFuncticrNames (index 1, line) 
_igentifyVariableNames (index #1, Line) 
index + 习 
cutbput () 


示例 8-3 ”使 用 正则 表达 式 检查 Python 程序 的 代码 风格 是 否 符合 规范 。 

本 例 代 码 主 要 检查 Python 程序 的 一 些 基本 规范 ,例如 ,运算 符 两 侧 是 否 有 空格 ,是 否 
每 次 只 导入 一 个 模块 ,在 不 同 的 功能 模块 之 间 是 否 有 空 行 ,注释 是 否 足 够 多 ,等 等 。 本 例 
代码 用 法 与 示例 8-2 中 的 代码 用 法 一 样 。 


inport sys 
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inport re 


Gef checkFbmmats (Lines, GesFileNeme) : 
fp =pan (GesFileNEre, 'w') 
for i, line in ermerate (lines) : 
Print (' =" * 30) 
Print ('Line:',i 机 ) 
if line.strip() .startswith('#): 
Print (' '* 10+'Caments.Fass.') 
fp.write (line) 
contimue 
flag Tre 
teck cperator synibols 
A 
tarp line Aine 
for synbol in syribols: 
Fattem =re.ompile(r' \s* ' +re.escape (synibol) +r'\s* ') 
tarp line -Fattem.split (tap line) 
Sep=" ' +synbol + ' 
tarp line =ssp.join (tarp line) 
if line ! tanp line: 
flag False 
Print (' ' * 10 +"You may miss soe blank spaces in this line.') 
teck jmport statiement 
if line.strip() .startswith ("inport') : 
i£f ',' in line: 
fag False 
Print (' ' * 10 +"You'd betber import cne rodule at a time.") 
tarp line <line.strip() 
modnles tarp 1line [terp line.incex(' ') 1:] 
modmes modules.strip() 
Pattem =re.ompile(r'\s* ,\s* ') 
mcules =pattem.split (trodules) 


= ="] 








tap line + 下 ine[:]ine.incex('inrport')] +'inport ' modle+'\n' 
Jine tarp line 
FPri line ines[i 1].strip() 
证 pri line and (not pri line.startswith('import')) and \ 
(oot pri line.startswith('#)): 
flag False 
Print (" ' * 10 +"You should acd a blank line befiore this line.') 
line="' Nn' Hine 
after line Aines[i #1].strip() 
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if after line and (not after line.startswith("import')): 
fag False 
Print (* '* 10+"'You should add a blank line after this line.') 
line Aine +'\n' 
heck if there js a blank line before new fnticnal oode block 
if line.strip() and not line.startswith(' ') and i »0: 
Eri line lines[i 1] 
if pri line.strip() and pri line.startswith(' '): 
flag -False 
print (* ' * 10 +"You'd better acH a blank line before this line.") 
line=' \n' Hine 


if flag: 
Print(' '* 10 +'Fass.') 

外 .write (line) 

外 .close () 
if_ pe = Wair 95 

fileNeme =sys.argv [1] 司令 行 参 数 
fileLines=[] 
with cpen (fileNeme, 'r') as fp: 

fileLines =fp.readlines () 


GesFileNere =fileName[: -3] +'_new.py" 

checkFbmets (fileLines, desFileNamre) 

Caments =[line for line in fileLines if line.strip() .startswith('#)] 
ratio =len (coments) /en (fileLines) 

if ratio <=-0.3: 





Print (‘Crmments in the file is less than 30% .') 
Print ('Perhaps you should act some oqments at acpropriate positian.') 
示例 8-4 使 用 正则 表达 式 批量 检查 网 页 文件 是 否 包含 iframe 框架 。 


inport os 
inport re 
GEf detectIframe (fn) : 
疗 放 网 页 文件 内 容 的 列表 
Ccntent =[] 


with apen (fh,encoding ="utf -8') as fp: 
赎 取 文件 的 所 有 行 ,删除 两 侧 的 空白 字符 ,然后 添加 到 列表 中 
for line in fp: 
content .append (line.strip()) 
把 所 有 内 容 连接 成 字符 串 
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contert =" ' .join (content) 
征 则 表达 式 
m=e.-fEincall (r' <iframe\s +src=. * ?></iframe >",omtent) 
ifm: 
贩 回 文件 名 和 被 溢 入 的 框架 
retim {fn:m} 
retum False 


for fm in (f for f in os.listdir('.') if f.endswith((' .html',' .hbm'))): 

r =GetectIfrare (m) 
if rot r: 

cntirne 
答 出 检查 结果 
for kv in Fr.items () : 

print (0) 

for vv inv: 

print (' \t',w) 








是 
8 数据 永久 化 : 文件 内 容 操作 


文件 是 长 久保 存 信息 并 允许 重复 使 用 和 反复 修改 的 重要 方式 ,同时 也 是 信息 交换 的 重要 
途径 。 记 事 本 文件 \ 日 志文 件 . 各 种 配置 文件 数据 库 文件 .图 像 文件 音频 视频 文件 、 可 执行 文 
件 、Office 文档 动态 链接 库 文件 等 ,都 以 不 同 的 文件 形式 存储 在 各 种 存储 设备 (如 磁盘 、U 盘 、 
光盘 云 盘 .网 盘 等 ) 上 。 按 数据 的 组 织 形式 可 以 把 文件 分 为 文本 文件 和 二 进 制 文件 两 大 类 。 


1. 文本 文件 


文本 文件 存储 的 是 常规 字符 串 , 申 若干 文本 行 组 成 ,通常 每 行 以 换行 符 \n 结尾 。 常 
规 字符 串 是 指 记事 本 之 类 的 文本 编辑 器 能 正常 显示 .编辑 并 且 人 类 能 够 直接 阅读 和 理解 
的 字符 串 ,如 英文 字母 ,汉字 .数字 字符 串 。 在 Windows 平台 中 ,扩展 名 为 txt ,log ini 的 文 
件 都 属于 文本 文件 ,可 以 使 用 字 处 理 软 件 如 gedit、 记 事 本 、ultraedit 等 进行 编辑 。 实 际 上 
文本 文件 在 磁盘 上 也 是 以 二 进 制 形式 存储 的 ,只 是 在 读 取 和 查看 时 使 用 正确 的 编码 方式 
进行 解码 还 原 为 字符 串 信息 了 ,所 以 可 以 直接 阅读 和 理解 。 

2. 二 进 制 文件 

常见 的 如 图 形 图 像 文件 . 音 视 频 文 件 .可 执行 文件 .资源 文件 .各 种 数据 库 文件 .各 类 
Office 文档 等 都 属于 二 进 制 文件 。 二 进 制 文件 把 信息 以 字 节 串 (bytes ) 进行 存储 ,无 法 用 
记事 本 或 其 他 普通 字 处 理 软件 直接 进行 编辑 ,通常 也 无 法 直接 阅读 和 理解 ,需要 使 用 正确 
的 软件 进行 解码 或 反 序列 化 之 后 才能 正确 地 读 取 、 显 示 .修改 或 执行 。 图 9-1 中 使 用 


Se i se se nan 

E E E -pn 
lp: El :D1 ; ‘ElinZ: 避 稻 多 1 和 CnmZ-EIKich:E] 四 
ev ?Ma + +t + 


总 于. 汶 
@ pdata bh P 1 
@ @.rol 





图 9-1 二 进 制 文件 无 法 使 用 文本 编辑 器 直接 查看 
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Windows 记事 本 打开 Python 主 程序 文件 pythonw. exe ,该 文件 是 二 进 制 可 执行 文件 ,无 法 
使 用 记事 本 查看 ,显示 乱码 。 也 可 以 使 用 hexeditor .010Editor 等 十 六 进 制 编辑 器 打开 二 进 
制 文件 进行 查看 和 修改 ,但 需要 对 不 同类 型 的 二 进 制 文件 结构 有 非常 深入 的 理解 ,如 图 
9-2 所 示 。 














Tana 
View Tools Specialst OFtions Wndow Help Da 
每 加 篇 | 一 也 国 吓 踊 | 轴 乱 读 屠 坦 一 是 二 字 | 本 南 邓 男 愉 苛 4b 白 国 |1@ 
otimes | 
Offsot | 0 1 2 3 4 567 689A3 cDErF = a 
00000000 |4D 5A 90 00 03 00 00 00 04 00 00 00 FF FF 00 00| ME » em 
00000010 |B8 oo oo oo 00 oo oo 00 40 oo oo oo oo 00 oo oo | . 上 CNPython3.5 
00000020 | oo 00 00 oo 00 oo 00 00 o0 00 00 00 00 00 00 oo 二 
00000030 , oo oo oo oo o0 oo 00 00 oo 00 00 00 00 0! 00 oa 


000ooo4o (OE IF BA OE 00 B4 09 CD 2z1 B6 ol 4c CD 21 54 56 0 “31 Ltlrh 
00000050 | 69 73 20 70 72 6F 67 72 61 6D 20 63 61 6E 6E 5F | ie program canno DefauktEditModo 
00000060 |74 20 62 65 20 72 75 5E 20 69 6E 20 44 4F 53 20 |t bo run in DOS State 


original 
00000070 | 6D EF 64 65 2E OD OD OA 24 00 00 00 00 00 00 ai 
00000080 | 4E SA 2B 3F OA 3B 45 5C OA 3B 45 6C OA 3B 45 Da 本 


00000090 | 03 43 D6 6C 00 3B 45 5C EF 62 44 6D 08 3B 45 


000000AO |EF 62 46 6D 08 3B 45 5C EF 62 40 6D 1A 3B 45 5 Creation time: 2015-12-06 





O00000B0 |EF 62 41 6D 01 3B 45 5C F8 62 44 6D 09 3B 45 ia 
90000050 | 37 cd 眩 6 08 38 45 5C CA 3 4d 6 38 38 45 Unwaeane 2015-12.0% 
06096090 ze 62 4 5 08 38 45 5C 59 62 BA 5C 08 38 45 CE 
90000080 re 62 47 5 09 38 45 5C 52 69 63 58 OA 38 45 Aibuts a 
D00000F0 | oo co 00 09 09 90 00 06 50 90 00 00 00 00 60 i 
00000100 | 50 45 00 609 64 68 06 60 38 95 63 38 00 00 00 

D0000110 | ao co o 09 Fo 00 22 90 eB 02 OE 60 00 14 60 ed 
00000120 |00 76 00 00 00 00 00 00 1C 13 00 00 00 10 00 ad 
90000130 oo co 60 2 09 60 00 90 é0 20 00 00 00 02 60 Se 
00000140 |08 60 00 00 09 00 00 90 08 00 00 00 00 00 00 . - 
D0000150 | 0 Do 00 09 09 04 00 0 66 18 01 00 03 00 50 ee : 
00000180 | 80 84 YE 09 09 00 00 oo 60 10 00 00 00 00 00 

00000170 |00 oo 10 00 00 00 00 00 00 10 00 00 00 00 00 Clipboard: available 














00000180 |00 00 00 op 10 00 00 00 00 00 00 00 00 00 00 o0 TEMP folden 167GB free | 


图 9-2 使 用 Winhex 十 六 进 制 编辑 器 打开 可 执行 文件 





9.1 文件 操作 基本 知识 


无 论 是 文本 文件 还 是 二 进 制 文件 ,操作 流程 基本 都 是 一 致 的 ,首先 打开 文件 并 创建 文 
件 对 象 ,然后 通过 该 文件 对 象 对 文件 内 容 进 行 读 取 、 写 入、 删除 .修改 等 操作 ,最 后 关闭 并 
保存 文件 内 容 。 


911 内 置 函 数 open( 


Python 内 置 函 数 open( ) 可 以 用 指定 模式 打开 指定 文件 并 创建 文件 对 象 ,该 函数 完整 
的 用 法 如 下 ,由 于 很 多 参数 都 有 默认 值 ,在 使 用 时 只 需要 给 特定 的 参数 传 值 即 可 。 


cpen (filevmode ='r', puffering = -1,encoding None, errors =None, newline =Nneclosefa =True, qpener = 
NEne) 
内 置 函 数 open( ) 的 主要 参数 含义 如 下 。 
(1) 参数 file 指定 要 打开 或 创建 的 文件 名 称 ,如 果 该 文件 不 在 当前 目录 中 ,可 以 使 用 
相对 路 径 或 绝对 路 径 ,为 了 减少 路 径 中 分 隔 符 \ 符 号 的 输入 ,可 以 使 用 原始 字符 串 。 
(2) 参数 mode( 取 值 范围 见 表 9-1 ) 指 定 打开 文件 后 的 处 理 方式 ,例如 “只 读 "“ 只 写 ” 
“ 读 写 “ 追 加 ”二进制 只 读 ”“ 二 进 制 读 写 "等 ,默认 为 “文本 只 读 模 式 ”。 以 不 同方 式 打 
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开 文 件 时 ,文件 指针 的 初始 位 置 略 有 不 同 。 以 “只 读 " 和 “只 写 " 模 式 打开 时 文件 指针 的 初 
始 位 置 是 文件 头 , 以 “追加 ”模式 打开 时 文件 指针 的 初始 位 置 为 文件 尾 。 以 “只 读 " 方 式 打 
开 的 文件 无 法 进行 任何 写 操 作 , 反 之 亦 然 。 
(3) 参数 buffering 指定 读 写 文件 的 缓存 模式 ,数值 0( 只 在 二 进 制 模 式 中 可 以 用 ) 表 示 
不 缓存 ,数值 1( 只 在 文本 模式 中 可 以 用 ) 表 示 使 用 行 缓存 模式 ,大 于 1 的 数字 则 表示 缓冲 区 
的 大 小 ,默认 值 是 -1。 当 使 用 默认 值 -1 时, 二进制 文件 和 非 交 互 式 文本 文件 以 固定 大 小 
的 块 为 缓存 单位 ,等 价 于 io. DEFAULT_BUFFER_SIZE ,交互 式 文本 文件 (isatty( ) 方 法 返回 
True) 采 用 行 缓存 模式 。 缓 存 机 制 使 得 修改 文件 时 不 需要 频繁 地 进行 磁盘 文件 的 读 写 操作 ， 
而 是 等 缓存 满 了 以 后 再 写 人 文件 ,或 者 在 需要 的 时 候 调 用 fush( ) 方 法 强行 将 缓存 中 的 内 容 
写 入 磁盘 文件 ,缓冲 机 制 大 幅度 提高 了 文件 操作 速度 ,同时 也 延长 了 磁盘 使 用 寿命 。 
(4) 参数 encoding 指定 对 文本 进行 编码 和 解码 的 方式 ,只 适用 于 文本 模式 ,可 以 使 用 
Python 支持 的 任何 格式 ,如 GBK .UTF-8 .CP936 等 , 详 见 标准 库 codecs。 
(5) 参数 newline 只 适用 于 文本 模式 , 取 值 可 以 是 None "nr 和 "rn 中 的 任何 一 
个 ,表示 文件 中 换行 符 的 形式 。 
如 果 执 行 正 常 ,open( ) 函数 返回 一 个 可 和 迭代 的 文件 对 象 ,通过 该 文件 对 象 可 以 对 文 
件 进 行 读 写 操作 ,如 果 指 定 文件 不 存在 .访问 权限 不 够 .磁盘 空间 不 够 或 其 他 原因 导致 创 
建文 件 对 象 失败 则 抛 出 异常 。 下 面 的 代码 分 别 以 读 、 写 方式 打开 了 两 个 文件 并 创建 了 与 
之 对 应 的 文件 对 象 。 
卫 =pan('filel .txt', 'r') 
2 =pan('file? .txt', 'w') 
当 对 文件 内 容 操作 完 以 后 ,一 定 要 关闭 文件 对 象 ,这 样 才 能 保证 所 做 的 任何 修改 都 被 
保存 到 文件 中 。 
£1.closel() 
需要 注意 的 是 ,即使 写 了 关闭 文件 的 代码 ,也 无 法 保证 文件 一 定 能 够 正常 关闭 。 例 如 ， 
如 果 在 打开 文件 之 后 和 关闭 文件 之 前 发 生 了 错误 导致 程序 崩溃 ,这 时 文件 就 无 法 正常 关闭 。 
在 管理 文件 对 象 时 推荐 使 用 9. 1.3 节 介 绍 的 with 关键 字 , 可 以 有 效 地 避免 这 个 问题 。 
表 9-1 文件 打开 模式 
模式 说 明 
r “| 读 模 式 ( 默 认 模 式 ,可 省 略 ) ,如 果 文 件 不 存在 则 抛 出 异常 
w | 写 模式 ,如 果 文 件 已 存在 , 先 清空 原 有 内 容 
x “| 写 模式 ,创建 新 文件 ,如 果 文件 已 存在 则 抛 出 异常 
a “| 追加 模式 ,不 覆盖 文件 中 原 有 内 容 
b “| 三 进 制 模式 (可 与 其 他 模式 组 合 使 用 ) ,使 用 二 进 制 模式 打开 文件 时 不 允许 指定 encoding 参数 
t | 文本 模式 (默认 模式 ,可 省 略 ) 
+ | 读 、 写 模式 (可 与 其 他 模式 组 合 使 用 ) 
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912 文件 对 象 属性 与 常用 方法 


如 果 执 行 正常 ,open( ) 函数 返回 一 个 可 迭代 的 文件 对 象 ,通过 该 文件 对 象 可 以 对 文 
件 进行 读 写 操 作 。 文 件 对 象 常用 属性 如 表 9-2 所 示 。 


表 9-2 文件 对 象 常用 属性 

















属 性 说 明 
buffer 返回 当前 文件 的 缓冲 区 对 象 
closed 判断 文件 是 否 关 闭 , 若 文件 已 关闭 则 返回 True 
fileno 文件 号 ,一 般 不 需要 太 关 心 这 个 数字 
mode 返回 文件 的 打开 模式 
name 返回 文件 的 名 称 





文件 对 象 常用 方法 如 表 9-3 所 示 。 


需要 特别 说 明 的 是 ,文件 读 写 操作 相关 的 函数 都 





会 自动 改变 文件 指针 的 位 置 。 例 如 ,以 读 模式 打开 一 个 文本 文件 , 读 取 10 个 字符 ,会 自动 
把 文件 指针 移动 到 第 11 个 字符 的 位 置 ,再 次 读 取 字符 的 时 候 总 是 从 文件 指针 的 当前 位 置 
开始 , 写 入 文件 的 操作 函数 也 具有 相同 的 特点 。 


表 9-3 文件 对 象 常用 方法 











方法 功能 说 明 
close( ) 把 缓冲 区 的 内 容 写 和 文件 ,同时 关闭 文件 ,并 释放 文件 对 象 
ey 分 离 并 返回 底层 的 缓冲 ,一旦 底层 缓冲 被 分 离 ,文件 对 象 不 再 可 用 ,不 允许 
做 任何 操作 
flush( ) 把 缓冲 区 的 内 容 写 入 文件 ,但 不 关闭 文件 





从 文本 文件 中 读 取 size 个 字 节 (Python 2.x) 或 字符 (Python 3.x) 的 内 容 作 为 











read( [ size] ) 结果 返回 ,或 从 二 进 制 文件 中 读 取 指 定数 量 的 字 节 并 返回 ,如 果 省 略 size 则 
表示 读 取 所 有 内 容 

readable( ) 测试 当前 文件 是 否 可 读 

readline( ) 从 文本 文件 中 读 取 一 行内 容 作 为 结果 返回 





readlines( ) 


把 文本 文件 中 的 每 行文 本 作为 一 个 字符 串 存 人 列表 中 ,返回 该 列表 ,对 于 大 
文件 会 占用 较 多 内 存 , 不 建议 使 用 





seek(offset[ , whence] ) 


把 文件 指针 移动 到 新 的 位 置 ,offset 表示 相对 于 whence 的 位 置 。whence 为 0 
表示 从 文件 头 开始 计算 ,1 表示 从 当前 位 置 开 始 计算 ,2 表示 从 文件 尾 开 始 
计算 ,默认 为 0 





seekable( ) 


测试 当前 文件 是 否 支 持 随机 访问 ,如 果 文件 不 支持 随机 访问 , 则 调用 方法 
seek( ) \tell( ) 和 truncate( ) 时 会 抛 出 异常 





tell( ) 


返回 文件 指针 的 当前 位 置 





truncate( [ size] ) 





删除 从 当前 指针 位 置 到 文件 未 尾 的 内 容 。 如 果 指 定 了 size, 则 不 论 指针 在 
什么 位 置 都 只 留 下 前 size 个 字 节 ,其 余 的 一 律 删除 
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续 表 
方 法 功能 说 明 
write(s) 把 字符 串 s 的 内 容 写 入 文件 
writable( ) 测试 当前 文件 是 否 可 写 
writelines(s) 把 字符 串 列表 写 入 文本 文件 ,不 添加 换行 符 





另外 ,Python 标准 库 codecs 中 的 open( ) 函数 也 提供 了 打开 文件 的 功能 ,返回 一 个 
StreamReaderWriter 对 象 ,同样 支 持 文件 的 读 写 操 作 。 该 函数 的 用 法 如 下 : 
pen (filename,mode ='r' ,enooding =None,errors ="'strict' ,buffering 31) 
其 中 的 参数 含义 与 内 置 函 数 open( ) 类似, 区别 在 于 如 果 指 定 了 encoding 参数 的 话 就 
会 强制 使 用 二 进 制 模式 。 标 准 库 codecs 中 有 关 的 源 代码 为 
if encoding is not Nene and pb' not in moce: 
mde ode +'b' 


913 上 下 文 管理 语句 with 


在 实际 开发 中 , 读 写 文件 应 优先 考虑 使 用 上 下 文 管理 语句 with ,关键 字 with 可 以 自动 
管理 资源 ,不 论 因为 什么 原因 (哪怕 是 代码 引发 了 异常 ) 跳 出 with 块 ,总 能 保证 文件 被 正 
确 关 闭 , 可 以 在 代码 块 执行 完毕 后 自动 还 原 进 入 该 代码 块 时 的 上 下 文 , 常 用 于 文件 操作 、 
数据 库 连 接 、 网 络 通 信和 连接 多 线程 与 多 进程 同步 时 的 锁 对 象 管理 等 场合 。 用 于 文件 内 容 
读 写 时 ,with 语句 的 用 法 如 下 : 

with cpen (filenare, mode, encoding) as fp: 

似 里 写 通过 文件 对 象 旬 读 写 文件 内 容 的 语句 


另外 ,上 下 文 管理 语句 with 还 支持 下 面 的 用 法 ,进一步 简化 了 代码 的 编写 。 


with cpen('test.b 引 '，' 习 '") as src, cpen('test newbt'，'w'") as dst: 
Gst.write (src.read()) 


9.2 文本 文件 内 容 操作 案例 精 选 


在 本 章 开 始 曾经 提 到 ,文本 文件 在 磁盘 上 也 是 以 二 进 制 字 节 串 的 形式 存储 的 ,在 操作 
文本 文件 内 容 时 ,一 定 要 注意 字符 串 的 编码 格式 ,否则 可 能 会 影响 内 容 的 正确 识别 和 处 
理 。 另 外 ,在 交互 模式 下 使 用 文件 对 象 的 write( ) 方法 写 人 文件 时 ,会 自动 显示 成 功 写 人 
的 字符 数量 。 如 果 想 不 显示 这 个 数字 ,可 以 先导 入 sys 模块 ,然后 执行 语句 sys. stdout = 
open( null', w') ,这 样 再 写 入 文件 时 就 不 会 显示 写 入 的 字符 数量 了 。 
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示例 9-1 将 字符 串 写 入 文本 文件 ,然后 再 读 取 并 输出 。 
5='Hello worldNm 文本 文件 的 读 取 方 法 mh 文本 文件 的 写 入 方法 np' 


with qpen('sanple.tzxt', 'w') as fp: 如 认 使 用 qse36 编码 
印 -write(s) 
with qpen('sanple.txt') as fp: 和 软 认 使 用 qpe36 编码 
Frint (fp.read()) 
示例 9-2 将 一 个 CP936 编码 格式 的 文本 文件 中 的 内 容 全 部 复制 到 另 一 个 使 用 UTF- 
8 编码 的 文本 文件 中 。 


ef 五 lecopy (src, dst, srcmooding, dstEnooding) : 
With cpen (src, 'r',enooding =srcEnooding) as srcfp: 
with apen (dst, Ww',encoding =dstnooding) as dstfp: 
dstfp.write (srcfp.read()) 


fileoopy ('sanple.txt', 'sanple new.txt', ‘qe936', "utf -8') 
示例 9-3 遍历 并 输出 文本 文件 的 所 有 行内 容 。 


with qpen('sanrple.txt') as fp: 棚 设 文件 采用 ce936 编码 
for line in fp: 和 艳 件 对 象 可 以 直接 迭代 
Print (line) 


示例 9-4 ”假设 已 有 一 个 文本 文件 sample. txt ,将 其 中 第 13 .14 两 个 字符 修改 为 测试 。 


with qpen('sanple.tixt', 'r+') as fp: 
人 fh.seek (13) 
外 .write(' 测 试 ) 
示例 9-5 ”假设 文件 data. txt 中 有 若干 整数 ,所 有 整数 之 间 使 用 英文 逗号 分 隔 , 编 写 
程序 读 取 所 有 整数 ,将 其 按 升序 排序 后 再 写 入 文本 文件 data_asc. txt 中 。 


with qpen('cata.tzxt', 'r') as fp: 


data =fp.readlines () 夸 取 所 有 行 
cata =[line.strip() for line in cata] 误 除 每 行 两 侧 的 空白 字符 
dta=', '.join(data) 褒 并 所 有 行 
dta=cata.split(',') 粉 隔 得 到 所 有 数字 字符 串 
data =[int (item) for item in data] 艇 换 为 数字 
cata.sort () 帮 序 排序 
ata =", ' .jointrep (str,data)) 将 结果 转换 为 字符 串 
with qpen('data asc.tit', 'w') as fp: 将 结果 写 入 文件 

fp.write (Gata) 


示例 9-6 统计 文本 文件 中 最 长 行 的 长 度 和 该 行 的 内 容 。 


with qpen('sanple.tixt') as fp: 
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result =[0, '"] 
for line in fp: 
ten(line) 
if t >result[0]: 
result =[t, line] 
Print (result) 


示例 9-7 使 用 标准 库 json 进行 数据 交换 。 

JSON( JavaScript Object Notation) 是 一 种 轻 量 级 的 数据 交换 格式 ,易于 阅读 和 编写 , 同 
时 也 易于 机 器 解析 和 生成 (一 般 用 于 提升 网 络 传输 速率 ) ,是 一 种 比较 理想 的 编码 与 解码 
格式 。Python 标准 库 json 提供 对 JSON 的 支持 。 

>>>inport jscn 

>>>x=[1,2,3] 

>>>jsan.dnps Co 好 列表 进行 编码 

‘2,3]" 

>>>jsan.loacs( ) 都 码 

[1,2,3] 

>>>x ={"'a':l, 'b':2, 'c':3} 峰 字 典 进 行 编码 

>>>Y 末 son.dumps (x) 

>>>type (y) 

<class 'str' > 

>>>jsan. loads (y) 

ta Le 

>>>with apen ('test.tit', 'w') as fp: 

jsan.Anp({'a':l, b':2,'c':3},fh) 伍 入 文件 


>>>with cben ('test.txt', 'r') as fp: 
Print (jsan.1load (fp)) 从 文件 中 读 取 


frew 2 


示例 9-8 ”使 用 csv 模块 读 写 文件 内 容 。 

CSV( Comma Separated Values) 格 式 的 文件 常用 于 电子 表格 和 数据 库 中 内 容 的 导入 和 
导出 。Python 标准 库 csv 提供 的 reader .writer 对象 和 DictReader .DictWriter 类 很 好 地 支持 
了 CSV 格式 文件 的 读 写 操作 。 另 外 ,csvkit 支持 命令 行 方式 来 实现 更 多 关于 CSV 文件 的 
操作 以 及 与 其 他 文件 格式 的 转换 , 感 兴趣 的 朋友 可 以 参考 下 面 的 网 址 : 


https://soroe .openews .org/en -US/articles/eleven -awesare -things -you -can -Gb -csvikat/- 
>>>import csv 
>>>with qpen('test.csv', 'w',newline ="') as ff: 
test_writer =csv.writer (fp,delimiter =' ',quotechar=""') 利 建 writer 对 象 
test writer.writerow (['red', blue', 'green']) 贿 和 一行 内容 
test writer.writerow(['test string'] * 5) 
>>>with qpen('test.csv',newline='') as fp: 
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[4 
test_reader -csv.reader (fp,delimiter =" ',quptedar ="") 章 建 reader 对象 
fer row in test reader: 妨 历 所 有 行 
Print (row) 竹 行 作为 一 个 列表 返回 


[ed ‘blue', 'green'] 
['test string', 'test string', 'test string', "best string', 'test string'] 
>>>with apen ('test.csv' ,newline ="') as fp: 
test_reader =csv.reader (fp,delimiter =':"', qotedhar=""") 赫 用 不 同 的 分 隔 符 
for row in test_reacer: 
Print (row) 娃 意 ,与 上 面 的 输出 不 同 
['red blue green'] 
['test_string test_ string test string test string test string'] 
>>>with qpen ('test.csv',newline ="') as fp: 
test_ reader =csv.reacer (fp, delimiter =" ',quotechar =""") 
for row jn test_ reader: 
Print( ' .join (row)) 重新 组 织 数 据 形式 





TIed,pluevgreen 
test_ string, test._ string, test_ string, test string, test string 
>>>with qpan ('names.csv', 'w') as fp: 

heacers =[' 姓 氏 ',' 和 名字 





test_dictWriter =csv.Dictwriter (fp, fieldnanes headers) 枪 | 建 Dictwriter 对 象 
倚 人 表 头 信息 
全 人 数据 
>>>with cpen (‘names.csv') as fp: 
test_dictReacer -csv.DictReacer (fp) 季 | 建 DictFeacer 对 象 
Print (', ' .join (test dictreader.fieldneres)) 赎 取 表 头 信息 
for row in test dictreader: 妨 历 文件 所 有 行 
Print (row[" 姓 氏 wzow[' 名 字 7) 
姓氏 ,名 字 
张 ,三 
李 , 四 
王 , 五 
示例 9-9 ”使 用 fleinput 模块 同时 显示 多 个 文本 文件 的 内 容 。 


with fileinput.inprt(files=('yanzhengmra-py' "tttt.PYD)) as f: 
for line in f: 
Print (line) 
把 下 面 的 代码 保存 为 display. py ,然后 在 命令 提示 符 环境 下 运行 python display. py a. 
txt b. txt c. txt 命令 ,可 以 依次 显示 指定 文件 a. txt、b. txt 和 cc. txt 的 内 容 。 
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for line in fileirput.input () : 
Print (line) 
示例 9-10 使 用 linecache 模块 访问 文本 文件 指定 行 的 内 容 。 
import linecache 


lineN nber =(0,1,2,5,9,9999) 
for line in lineNnber: 
重用 getline 0 函数 访问 指定 文件 中 的 某 行内 容 
茹 果 指 定 的 行 不 存在 则 返回 空 字符 串 
Print (linecache .getline ('yanzhengra.py', Line)) 
linecahe .clearcache () 
示例 9-11 编写 程序 ,统计 指定 目录 所 有 C ++ 源 程序 文件 中 不 重复 代码 的 行 数 。 
本 例 只 考虑 C ++ 源 程 序 文件 (扩展 名 为 cpp) ,并 且 只 认为 严格 相等 的 两 行为 重 
复 行 。 
fram cs.Fath import isdir, join 
fram cs import listdir 


NotRepeatedLines =[] 哥 存 非 重 复 的 代码 行 
file nm=0 信件 数量 

coce num=0 并 码 总 行 数 

GEf Linescount (directory) : 


gcbal NotRepeatedLines, file man code nm 
for 和 ileneame in listdir (directory) : 


tenp =join (Girectory, filenamre) 
if isdir(terp) : 姓 归 遍历 子 文件 夹 
Iinescount (berp) 
elif tenp.endswith(' .qqp'): 可 考虑 .aq 文件 
file nm + 
with cpen (tenrp, 'r') as fp: 
for line in fp: 
line Aine.strip() 制 除 两 端的 空白 字符 
if line not in NbtFepeatearines: 
NotRepeatedLines.append (line) 所 录 非 重复 行 
code nm + 导 所 录 所 有 代码 行 


Fath=r'C: \Users \DongNDesktop\VC++6.0" 
Prinmt ("总行 数 : {0}, 非 重复 行 数 : {1}'.fomat (code nam len (NotRepeatedLines))) 
Print ("文件 数量 : {0}' .fomrat (file mm) 


示例 9-12 修改 HTML 网 页 文件 ,使 用 iframe 框架 嵌入 另 一 个 HTML 页 面 。 
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GEf infectHtm (fileNemeyinfectecpcontent) : 
with apen (FileNeme, 'a+') as fp: 
下 -write (infectbecconbent) 


ontent =" <iframe src 一 anctherHtml .html" height -50px width -200px > </ifrare >" 
infectHbml (‘index.html ', ontent) 
示例 9-13 修改 HTML 网 页 文件 ,插入 网 页 打开 时 能 够 自动 运行 的 JavaScript 脚本 。 
Gef infectHbml (FileNeme infecteccontent) : 
with aqpen (fileNeme 'r') as 名 : 
lines =fp.readlines () 
for index, line in enumerate (lines) : 
if line.strip() .lcwer () .startswith(' <html >'): 
lines.insert (index Hinfecteccontent) 
break 
with cpen (FileNeme, 'w') as fp: 
fp.writelines (lines) 


content =" <head > <script window.nload =finctian () {alert ("test");} </script > </head >' 
infectHbml ('index.html', ontent) 


示例 9-14 ”使 用 扩展 库 chardet 判断 文本 文件 的 编码 格式 。 
jnmport charcet 
inport sys 
with aqpen (sys.argv [1], "mb') as fh: 
Print (dardet .detect (fp.read())) 


9.3 二进制 文件 操作 案例 精 选 


数据 库 文件 .图 像 文件 .可 执行 文件 .动态 链接 库 文件 音频 文件 .视频 文件 、Office 文 
档 等 均 属 于 二 进 制 文件 。 对 于 二 进 制 文件 ,不 能 使 用 记事 本 或 其 他 文本 编辑 软件 直接 进 
行 正常 读 写 ,也 不 能 通过 Python 的 文件 对 象 直 接 读 取 和 理解 二 进 制 文件 的 内 容 。 必 须 正 
确 理解 二 进 制 文件 结构 和 序列 化 规则 ,然后 设计 正确 的 反 序列 化 规则 ,才能 准确 地 理解 二 
进 制 文件 内 容 。 

所 谓 序列 化 ,简单 地 说 就 是 把 内 存 中 的 数据 在 不 丢失 其 类 型 信息 的 情况 下 转 成 二 进 
制 形 式 的 过 程 ,对 象 序列 化 后 的 数据 经 过 正确 的 反 序 列 化 过 程 应 该 能 够 准确 无 误 地 恢复 
为 原来 的 对 象 。Python 中 常用 的 序列 化 模块 有 struct .pickle .shelve 和 marshal。 


931 使 用 pode 模块 读 写 二 进 制 文件 
标准 库 pickle 提供 的 dump( ) 方 法 (protocol 参数 为 True 时 可 以 实现 压缩 的 效果 ) 将 
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数据 进行 序列 化 并 写 入 文件 ,load( ) 方 法 读 取 二 进 制 文件 内 容 并 进行 反 序列 化 ,还 原 为 原 
来 的 信息 。 
示例 9-15 使 用 pickle 模块 读 写 二 进 制 文件 。 


inport picde 


主导 3000000 

己 =99.056 

s=' 中 国人 民 123abc' 

lst=[[1,2,3], [4,5,6], [7,8,9]] 

tu=( -5,10,8) 

coll ={4,5,6} 

dic={'a':'apple', 'b':'banana', 'g':'grape', '0':'orange'} 
Gata=(ivarsrlstvtbarcollvdic) 


with aqpen('sanrple pickle.dat', 'wib') as f: 


try: 
pidde.dnp(len (data) ,f) 硬 序 列 化 的 对 象 个 数 
for :item in cata: 
pickle.Anp(item,f) 疗 列 化 数据 并 写 入 文件 
except: 


print (' 写 文件 异常 ') 


with qpen('sanple pickle.dat', 'rb') as f: 


n=pidde.load(f) 赎 出 文件 中 的 数据 个 数 
for i in range (nN): 
x=pickle.load(f) 赎 取 并 反 序列 化 每 个 数据 
Print (2) 


示例 9-16 ”把 文本 文件 test. txt 中 的 所 有 信息 使 用 pickle 进行 序列 化 并 写 入 二 进 制 
文件 test_pickle. dat。 


import piclae 


with qpen('test.txt') as src,opan('test pidde.dat', rib') as dest: 
for line in src: 
Pickle.dmp Qine,aest) 


with qpen('test_pickle.datv "tb') as 印 : 
while True: 
try: 
Print (pickle. 10ad (fp)) 
exept: 
Ireak 
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pickle 模块 还 提供 了 一 个 dumps( ) 和 loads( ) 函数 ,前 者 可 以 返回 对 象 序列 化 之 后 的 
字 节 串 形 式 , 后 者 用 来 把 序列 化 的 字 节 串 反 序列 化 得 到 原始 数据 。 


>>>pickdle.dnps ([1,2,3]) 疗 列 化 列表 
b' \xB0 O31]q 00 (K YDIK OK D3e." 
>>>pickle.dmps(0L,2,3,4]) 
P' YB0 D3]q WO0 (K VDIK YO2K YO3K yD4e.' 
>>>Pickle.dmps ({1,2,3,4)) 秆 列 化 集合 
P' vB0 v03adomuiltins \nset \nq YO0]q VO! (K YOIK OPK YO3K D4e YBS5q YO2RA YO3." 
>>>picde.dnps ({1,2,3)) 
b' vB0 v03adomuiltins \nset \nq YO0]q YO! (K YOIK OK YO3e HB5q9 ORA V03." 
>>>pickde.dnps ((1,2,3)) 夺 列 化 元 组 
P' vB0 VD3KNDIKVO2KNVD3 Ye7qN00." 
>>>pickle.dmpes (123) 疗 列 化 数字 
b' vB0 \xO3K{." 
>>>pickle.loacs ( ) 要 序列 化 
123 


932 使 用 struct 模块 读 写 二 进 制 文件 


使 用 struct 模块 需要 使 用 pack( ) 方 法 把 对 象 按 指定 的 格式 进行 序列 化 ,然后 使 用 
文件 对 象 的 write( ) 方法 将 序列 化 的 结果 写 人 二进制 文件 ; 读 取 时 需要 使 用 文件 对 象 的 
read( ) 方 法 读 取 二 进 制 文件 的 内 容 , 然 后 再 使 用 struct 模块 的 unpack( ) 方 法 反 序 列 化 得 
到 原来 的 信息 。 

示例 9-17 使 用 struct 模块 读 写 二 进 制 文件 。 


inrport struct 





了 村 300000000 

X=-96.45 

P=mruoe 

s="'al@ 中 国 ' 

n=struct.pack ("if?',n,x,b) 疗 列 化 并 表示 整数 ,f 表 示 实 数 ,“ ?表示 迎 辑 值 


with qpen('sanrple struct.Gat' wb') as f: 
£f.write (sn) 
f.write (s.encode ()) 述 符 串 需 要 编码 为 字 节 串 再 写 入 文件 


with qpen('sanple struct.dat', '1b') as f: 


nf.read(9) 
t=struct.upack("if?',sn) ”楼 用 指定 格式 反 序列 化 
nx bl tu 秆 列 解 包 


Print (n=",n, x=",x, bl =",bl) 
s.read(9) 
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5 二 -Gecode0 疗 符 串 解 码 
print ('s=',s) 
在 上 面 的 代码 中 ,首先 读 取 9 个 字 节 然后 进行 反 序列 化 ,再 读 取 9 个 字 节 并 解码 为 字 
符 串 。 后 者 之 所 以 是 9 个 字 节 是 因为 字符 串 的 encode( ) 方法 默认 使 用 UTF-8 编码 格式 ， 
使 用 3 个 字 节 表示 一 个 中 文 符号 ,使 用 一 个 字 节 表示 英文 符号 。 而 前 者 之 所 以 是 9 个 字 
节 跟 struct 模块 的 序列 化 规则 有 关 , 每 个 类 型 的 数据 序列 化 时 占用 的 字 节 数 是 固定 的 。 


>>>import struct 
>>>struct .pack ("if?"',13000,56.0, True) 
b' B82 YD0 DO0 DO0YoO0BNYol1' 

>>>len(_) 

8 

>>>len (struct .pack ('if?",9999, 5336.0, False)) 
9 

>>>x='al@ 中 国 ' 

>>>len (x.encode ()) 

Eg 


933 使 用 shdve 模块 操作 二 进 制 文件 


Python 标准 库 shelve 也 提供 了 二 进 制 文 件 操作 的 功能 ,可 以 像 字典 赋值 一 样 来 写 人 
二 进 制 文件 ,也 可 以 像 字典 一 样 读 取 二 进 制 文件 。 


>>>inport shelve 
>>>zhangsan ={ 'age' :38, 'sex' : Male', 'actiress' : 'SDIET"'} 
>>>1isi ={"'age' :40, 'sex' : "Male', 'aH' : "1234567', "tel' : '7654321'} 
>>>with shelve.apen('shelve test.dat') as fp: 
fp['zhangsan'] 一 hangsan 杞 字典 形式 把 数据 写 入 文件 
fp['lisi'] Aisi 
for i in range (5): 
fp[str(i)] =str(i) 
>>>with shelve.qpan('shelve test.dat') as fh: 
Print (fp['zhangsan']) 赎 取 并 显示 文件 内 容 
Print (fp[l'zhangsan'] ['age']) 
Print (fp['lisi'] ['qg']) 
Print (fp['3"]) 
{'sex': ‘Male', 'aciress': 'sDIBT', 'age': 38} 
38 


1234567 
和 


934 使 用 marsha 模块 操作 二 进 制 文件 
Python 标准 库 marshal 也 可 以 进行 对 象 的 序列 化 和 反 序列 化 。 
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>>>import mrarshal 好 入 模块 
>>>a =30 特 序 列 化 的 对 象 
>>>2 5.0 


>>>3 =[1,2,3] 
>>>x4 =(4,5,6) 
>>>5 ={"'a':l, 'b':2, 'c':3} 


>>>x6 ={7,8,9} 
>>>x=[eval ('x' +str (i)) for i in range 1, 静 需要 序列 化 的 对 象 放 到 一 个 列表 中 
>>>x 
[30,5.0, [1,2,3], (4,5,0), {'a': 1, b': 2,'c': 3}, {8,9,7}] 
>>>with apen ("test.dat', "Wb') as fp: 帘 | 建 二 进 制 文件 
marshal .dnp (en co , fh) 紫 写 人 对 象 个 数 
for item in x: 
marshal .dnp (item, fp) 起 列 表 中 的 对 象 依次 序列 化 并 写 入 文件 
>>>with aqpen (test.dat' pb) as fh: 朵 开 二 进 制 文件 
n =aarshal .lcaci(fp) 砍 取 对 象 个 数 
for i in rangen): 
Print rarshal .load (fp)) 要 序列 化 ,输出 结果 
30 
5.0 
[eR 
(4,5,6) 
ta Le 3 
{8,9,7} 


与 pickle 类 似 ,marshal 也 提供 了 dumps( ) 和 loads( ) 函数 来 实现 数据 的 序列 化 和 反 
序列 化 ,从 下 面 的 结果 可 以 看 出 ,使 用 marshal 序列 化 后 的 字 节 串 更 短 一 些 , 可 以 减少 磁盘 
空间 或 网 络 带宽 的 占用 。 


>>>import marshal 

>>>marshal .dps (' 董 付 国 ') 

b' NE5 \t \¥00 VD0 DO0 VE8 YI91 ve3 VE4 Wb 98 YE5 Yobviba' 
>>>rarshal.lcacs ( ) 

' 董 付 国 ' 

>>>len trarshal.dmps(' 董 付 国 ')) 

14 

>>>inport picae 

>>>len (pickle.dnps (' 董 付 国 ')) 

19 


935 其 他 常见 类 型 二 进 制 文件 操作 案例 
示例 9-18 使 用 Python 扩展 库 xlwt 把 数据 写 入 Excel 2003 或 更 低 版 本 的 文件 ,然后 
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用 扩展 库 xlrd 读 取 并 输出 显示 。 


fram xlwt irport * 


jimport xlrd 
book Woriioook () 人 | 建新 的 Eeel 文件 
Sheetl -book.add sheet ("First") 评 加 新 的 waresheet 
al Aligment () 
al -horz Aligment .HRZ CENIER 册 齐 方式 
al-vert Aligment .VERT CENIER 
borders =Porders () 
Lorders.bottan=Borders .THICK 其 框 样式 
style -xEStyle() 
style-aligrment -al 
Style.borders -Porders 
Tow =sheetl .row (0) 黎 取 第 0 行 
Tow.write (0, 'test', style =style) 全 人 单元 格 
Tow=sheetl .row (1) 
for i in range (5): 

Tow.write (i,i, style =style) 枉 入 数字 
Tow.write (5,' -SIM2:E2) ',style=style) 全 人 公式 
bock.save (r'D: \test.x15') 哥 存 文件 


bock=adlrd.aqpen workbook(r'D: \test.x15') 


sheetl -bock.sheet by nare('First') 
row =sheet1 .row (0) 

Erint (row[0] .value) 

Print (sheetl .row (1) [2] .value) 


示例 9-19 使 用 扩展 库 openpyxl 读 写 Excel 2007 以 及 更 高 版 本 的 文件 。 


jimport operpyxl1 

fram qperpyx] irport Workoook 

fn =r'f: \test .xlsx' 和 个 件 名 

WwW Arkbock(O 创建 工作 短 

Ww Wb.create shest (title=' 你 好 ,世界 ') 齐 建 工作 表 

Ww['A1'] =' 这 是 第 一 个 单元 格 ' 镁 元 格 赋值 

ws['B1'] 3.1415926 

加 -save (mn) 哥 存 Excel 文件 

Wh -penpysd .load workbook(fn) 朵 开 已 有 的 Boal 文件 
ws =wb.workshests [1] 亲 开 指定 索引 的 工作 表 
Print (ws['Al'] -value) 鞍 取 并 输出 指定 单元 格 的 值 
ws-append([1,2,3,4,5]) 业 加 一 行 数据 

Ws.merge oells('F2:F3') 栓 并 单元 格 
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ws['F2'] >"=sm(2:E2)" 和 大 入 公式 
for r in range (10,15) : 
for c in range (3,8): 
_ =5.cel (rw -x,cohum -cvalue 入 c 和 单元 格 数据 
wo.save (Im) 


假设 某 学 校 所 有 课程 每 学 期 允许 多 次 考试 .学生 可 随时 参加 考试 ,系统 自动 将 每 次 成 
绩 添加 到 Excel 文件 (包含 3 列 : 姓名 、 课 程 、 成 绩 ) 中 , 现 期 末 要 求 统计 所 有 学 生 每 门 课 
程 的 最 高 成 绩 。 下 面 的 代码 首先 模拟 生成 随机 成 绩 数据 ,然后 进行 统计 分 析 。 

inport operpyxl 

fram qperpyx] jnmport Workbook 

inport rancom 


杜 成 随机 数据 

Gef generatsRanccmriImformmaeticn (fileneme) : 
workoook -brkbook() 
Worksheet =workibook.workshests [0] 
workshest.append([' 姓 名 ', "课程 ',' 成 绩 ']) 


仲 文 名 字 中 的 第 一 、 第 二 ,第 三 个 字 
first =' 赵 钱 孙 李 ' 
micdle =" 伟 易 琛 东 ' 
last 一 坤 想 志 ， 
subjects=(" 语 文 ， 数学" 英语 7) 
for i in range (200): 
line=[] 
r=random.randint (1,100) 
name 一 ancom.chpice (first) 
婉 一 定 概率 生成 只 有 两 个 字 的 中 文 名 字 
if r>50: 
name =name +randm.dhoioe rice) 
name ane +randm.dpoioe (last) 
由 次 生成 姓名 ,课程 名 称 和 成 绩 
line.append (nane) 
line.atpend (randam.dhoice (sibjects)) 
line.append (randam. randint (0,100)) 


workcshest .append (line) 
积存 数据 ,生成 Bosl 2007 格式 的 文件 
workbook. save (fFilename) 


GEf getFesult (oldfilevnewfile) : 
胡 于 存放 结果 数据 的 字典 
result -dict 0) 
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朵 开 原始 数据 
worbook =cperpyxl .10ad woridoook (clafile) 
workcsheet =—woribook.workcshests [0] 


妨 历 原始 数据 
for row in worksheet .rows: 


i row[0] .value==' 姓 名 ': 
contine 
竹 名 ,课程 名 称 、 本 次 成 绩 
nene, sbject, grace =row[0] -value, row[1] .value, row[2] .valie 


夺取 当前 姓名 对 应 的 课程 名 称 和 成 绩 信息 
妆 果 resmt 字 典 中 不 包含 , 则 返回 空 字典 
t=result.get (namev {}) 
岁 取 当前 学 生 当 前 课程 的 成 绩 , 若 不 存在 ,返回 0 
ft.get (subject,0) 
可 保留 该 学 生 该 课程 的 最 高 成 绩 
if grace >f: 
t[sibject] -grade 
result name] Tt 


workbook] =Workpook () 
worksheet] =—workoook .worksheets [0] 
workshest1 .append([' 姓 名 ',' 课 程 ',' 成 绩 ']) 


将 result 字 典 中 的 结果 数据 写 信 Beal 文件 
fr namevt in result .items () : 


Print mamevt) 
for sibject, grade in t.items (0 : 
worksheetl .append ( [neare sibject, grade]) 





示例 9-20 ”把 记事 本 文件 test. txt 转换 成 Excel 2007 + 文件。 假设 test. txt 文件 中 第 
一 行为 表 头 ,从 第 二 行 开始 是 实际 数据 ,并 且 表 头 和 数据 行 中 的 不 同 字段 信息 都 是 用 逗号 


分 隔 。 


fram operpyxl irport Wibock 


Gef main (CxtFileNeme) : 
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new XlsxFileName -txtFileNene[: -3] +'xlsx' 
wp orkbook () 
ws .workshests [0] 
with apen (bxtEileNere) as fp: 
for line in fp: 
line Aline.strip() .split (',') 
ws.apend (Line) 
Wh.save (new XlsxFileNeme) 


main('test.txt') 
示例 9-21 检查 Word 文档 的 连续 重复 字 , 例 如 “用 户 的 的 资料 "或 “需要 需要 用 户 输 
入 "之 类 的 情况 。 本 例 使 用 扩展 库 python-docx 读 写 Word 2007 + 文档 内 容 。 


fram dbcx inport Document 
Gbc =Document(《 Pythan 程序 设计 开发 宝典 》.cocxe') 


contents ="' .join ( (p.text for p in dbc.Faragrachs)) 
words =[] 
for index, ch in ermerate (omtents[: -2]): 
if ==omtents[index #1] or ==omtents[index +2]: 
word =contents [index: index +3] 
if word nct in words: 
words.append (word) 
Print (word) 
示例 9-22 小 学 口算 题库 生成 器 。 
inport ranccm 
inport os 
需要 安装 扩展 库 Python -cbcx 
fram abcx import Dooment: 


olumsNinber =4 


GEf main (rowsNinber =20, grace =4) : 
妖 认 生成 20 行 小 学 四 年 级 口算 题 
if grace 3: 
perators='+ —" 
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biggest 00 


bament =Dccumert () 
冶 | 建 表格 
table =Dcumert.aca table (rows =rowsNiniber, oo1s =-DlumsNoier) 
妨 历 每 个 单元 格 
for row in range (rowsNinber) : 
for col in range (comsNinber) : 
first =randam.randint (1 ,biggest) 
second =randoam.randint (1 ,biggest) 
perator =randam. dpioe (aqperatiors) 
if aperator !=" ("': 
if cperator ==" 一 "2 
站 ! 果 是 减法 口算 题 , 确 保 结果 为 正 数 
if first <seccnq: 
first, seccnq =seong), First 
r=str (first) .ljust @,' ') +' ' +aperator 
+Str (seoond) .Hjust @,' ') +'=" 





else: 
性 成 带 括号 的 口算 题 ,需要 3 个 数字 和 2 个 运算 符 
third =randoam.randint (1 ,100) 
while True: 
dl = 一 anccm.choice (aperators) 
ce2 =randm. pice (aqperatiors) 
if ol !=' (anace 1="'(': 


Seccne third =third, seccnal 
r=str(first) .1JustC,' ') + + ('\ 
+Str Gecong) .just@,' ') 40 +Strtthird) .1just@,' ') +")=" 


else: 
if ol ==" —": 
if first <seond: 
first,seomnd =seomnd, Hirst 


r="'(" +str(first) .ljust@,' ') +0l \ 
+str (secong) .ljust @,' ') +)" \ 
+CP +str (thira) .Hjust @,' ') +'=" 
餐 取 指定 单元 格 并 写 入 口算 题 
Cell table.cell (row,ool1) 
Cell.text =r 
Poment .save ('kousuan.docx') 
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05.startfile('kousuan.docz') 


rain grace 5) 
示例 9-23 提取 docx 文档 中 的 例题 .插图 和 表格 清单 。 
fram abcx inport Document 


inport re 


result ={'1i':[],'fig':[],'tab':[]} 
dpc Document (r'C: \Eythcn 高 级 编程 .docx') 


for p in doc.paragraths: 妨 历 文档 所 有 段落 
t=p.text 雁 取 每 一 段 的 文本 
秆 Imatch(' 例 +-a+'tb): 攀 题 
result ['1i'] .append(t) 
elif re.math(' 图 \d+-\d+',t): 睛 图 
result['fig'] .apperd (t) 
elif re.matqh(' 表 \d+-\d+',t): 姜 格 
result ['tap'] .append (t) 
for key in result .keys(): 答 出 结果 
Print (' =" * 30) 
for value in result [key]: 
Print (value) 


示例 9-24 ”编写 代码 ,查看 指定 ZIP 和 RAR 压缩 文件 中 的 文件 列表 。 
Python 标准 库 zipfile 提供 了 对 ZIP 和 APK 文件 的 访问 。 


>>>inport zipfile 
>>>with zipfile.zipFile('test.zip") as fh: 
for fn in fp.namelist (): 
print (fn) 抬 果 中 文 显 示 乱 码 
何以 参考 后 面 的 例 9 -26 进 行 修改 


Python 扩展 库 rarfile( 可 通过 pip 工具 进行 安装 ) 提供 了 对 RAR 文件 的 访问 。 
>>>import rarfile 
>>>writh rarfile.FarFile ('aundictools -0.1.0.rar') as 外 : 
for fn in fp.namelist (): 
Erint (fn) 
示例 9-25 将 指定 文件 夹 中 的 文件 压缩 至 已 有 的 ZIP 压缩 文件 。 
framn os jnmport listdir 
fram 05.path inport isfile, isdir, join 
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GEf acbPilerntozipfile (srcpir, fh) : 
妨 历 该 文件 夹 中 的 所 有 文件 
for sipath in listdir (srcpir) : 
Sipath 一 join (srcpir, sdbpath) 
if isfile (stpath) : 
坝 ] 果 是 文件 就 直接 压缩 到 zIP 文 件 
下 -write (sbpath) 
elif isdir (sibpath) : 
茹 I 果 是 子 文件 夹 就 先 写 入 子 文件 夹 名 
贱 后 再 递归 调用 函数 
把 所 有 文件 都 压缩 进入 zIP 文 件 
Pp-write (sepath) 
acHiFileTntozipfile (sipath, fp) 


GEf zipompress (srcDir, GesZipfile) : 
with zipEile (deszipfilermode ='a') as ff: 
actipilermntozipfile (srcpir, fh) 


出 试 函数 功能 
Paths =[r'C: \python34 \scripts',r'C: \python34 \Dlls'r'c: \eclipse'] 
for path in paths: 
Zipompress (ath 'test.zip') 
示例 9-26 ”使 用 密码 字典 暴力 破解 RAR 或 ZIP 文件 密码 。 
本 例 使 用 标准 库 zipfile 和 扩展 库 unrar 实现 主要 功能 。 如 果 下 面 的 代码 不 能 运行 ,可 
能 需要 做 以 下 几 个 操作 : 外 到 http://www. rarlab. com/rar/UnRARDLL. exe 下 载 并 安装 
unrardll 库 ,然后 根据 需要 把 安装 文件 夹 中 的 UnRAR. dl 或 x64\UnRAR64. dll 文件 复制 
到 unrar 安装 文件 夹 (例如 ,C:\Python 3.5\Lib\site-packages\unrar) 中 ; @ 打 开 unrar 安装 
文件 夹 中 的 unrarlib. py 文件 ,把 第 43 行 lib _ path = lib _ path or find _ library 
("unrar. dll" ) 直接 改 为 unrarlib = ctypes. WinDLL(r" C: \Python 3. 5 \Lib\site-packages \ 
unrar\UnRAR64. dll" ) ,并 把 接 下 来 的 两 行 代 码 删除 或 注释 。 
jnmport os 
jmport sys 
import zipfile 攻 ipfile 是 标准 库 
try: 
fran unrar import rarfile 妊 试 导入 扩展 库 , 如 果 没 有 就 临时 安装 
except: 
Fath='""' +os-Fath.dimame (sys.esecutable) +' \\scripts \\pip" install - -upgrace pip' 
05.system (path) 
path="" +0s.path.dimere (sys .eecutable) +' \\scripts \\pip" install unrar' 
05.system (path) 
fram unrar import rarfile 


® 
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GEf decryptFarzipEile (fFileneme) : 
if filename.endswith(' .zip'): 
p=zipfile.2iprile (Filename) 
elif fileneme.endswith(' .rar') : 
fp =rarfile.FarFile (Filenare) 
cesPath =filename[: -4] 都 压缩 的 目标 文件 夹 
j not cs-path.esxists (Gespath) : 
os .mdiir (GesPath) 
try: 峰 试 不 用 密码 解压 缩 
fp.extractall (desPatih) 
fp.close() 
Print (NP password') 


except: 在 用 密码 字典 进行 暴力 破解 


人 EPEwda=open ("pwodict.tst') 
except: 
Print (ND dict file Pwctiict.bt in current directory.') 
retum 
for pwd in ffPwa: 
Prd=pd.rstrip() 
try: 
if filename.endewith(' .zip'): 
for file in 外 -narelist 伍 新 编码 再 解码 ,避免 中 文 乱码 
印 .extract (fFile,path -desPath,prd =pwdi.encode ()) 
05.rename (desPath +' \\' +file, 
cesFath +' \\' +file.encode ('qp437') .decode ('gox')) 


fp.extractall (path =cesPath,prd =pwd) 


Print ("Success! ====>" +pwd) 
fp.close() 
break 
exospt: 
Fass 
fewdi.close() 
if_ ne _== min _': 


证 os.path.isfile (filename) and filenere.endswith(('.zip', '.rar’)): 
GEcryptRarzipEile (filenare) 
else: 
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Print (Must be Far or Zip file') 

示例 9-27 ”使 用 Python 标准 库 tarfile 把 当前 文件 夹 中 所 有 . py 文件 压缩 为 gzip 格式 
的 压缩 文件 ,然后 再 解压 缩 到 指定 文件 夹 中 。 

jnmport os 

jimport tarfile 


with tarfile.qpen('sanple.tar', 'w:g2') as tar: 
for neme in [f for f in os.listdir('.') if f.endswith(' .py')]: 
tar.acd (name) 


with tarfile.qpen('sarple.tar', 'r:gz') as tar: 
tar.extractall (rath='sanple') 

示例 9-28 判断 指定 文件 是 否 为 PE 文件 。 

PE 的 全 称 Portable Executable ,意思 是 可 移植 的 可 执行 文件 ,目前 最 新 版 本 是 2016 年 
6 月 15 日 发 布 的 10.0 版 。PE 文件 包括 exe 文件 .com 文件 .dl 文件 .ocx 文件 、sys 文件 、 
scr 文件 等 Windows 平台 上 所 有 可 执行 文件 类 型 ,是 Windows 操作 系统 和 Windows 平台 上 
所 有 软件 和 程序 能 够 正常 运行 的 重要 基础 。 每 种 文件 有 独特 的 specification 用 来 说 明文 
件 头 结构 和 内 容 组 织 方式 ,依赖 specification 来 判断 文件 类 型 比 扩展 名 更 加 准确 。 

jimport sys 

jimport os 


if len(sys.argv) ! 之 : 
Print ('Usage: {0} anctherFile' .feet (sys.argv[0])) 
sys.exit () 


filename =sys.argv [1] 页 取 要 检测 的 文件 名 
证 not os.path.isfile (filename) : 制 断 是 否 为 文件 
print (filename +' is not file.') 
sys.exit () 


with open (全 leneame "rb') as fp: 
Hag = 中 .reaaC) 往 取 文件 前 两 个 字 节 
全 .sssk(xsc) 夺取 王 头 偏 移 
offset =ord (fp.read (1)) 
全 .seek (offset) 
flagp fp.read (4) 风 取 更 头 签名 
if fag 一 志 ME' and 日 acP = 志 ' 杰 YO0vD0': 后 断 是 否 为 更 文 件 的 特征 签名 
Frint (filename +' is a FE file.') 
else: 
Frint (filename +' is nct a file.') 
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示例 9-29 批量 提取 普通 PDF 文件 中 的 文本 并 转换 为 TXT 记事 本 文件 。 

本 例 需 要 首先 使 用 pip install pdfminer3k 安装 扩展 库 pdfminer3k ,然后 可 以 使 用 命令 
行 工 具 pdf2txt. py 对 PDF 文件 进行 转换 ,下面 的 代码 将 其 封装 起 来 实现 批量 转换 。 

jimport os 

inport sys 

import time 


pifs =(pdfs for pdfs in os.1istdir('.') if padfs.endswith(' .par')) 


for pafl in pdfs: 
珊 换 文件 中 的 指定 字符 
Faf -afl.replace(' ','_') .replace(' —',' ') .replace('g',' ') 
05.rename (pafl,Paf) 
Print (' =" * 30+' \n',paf) 


txt paf{: -4] +' .txt' 
ee='"' +5y5.executable + 
PIPtxt =05 .path.dimane (sys .executable) 
Paf2bxt pIPtt +'\\scripts\\piPtt.py" -0' 
try: 
柚 用 命令 行 工 具 pi2tt.py 进行 转 换 
着 果 Paf 加 密 过 ,可 以 改写 下 面 的 代码 
症 -前 面 使 用 卫 来 指定 密码 
amd =exe tpdPtxt HE + Haf 
c5.Pcpen (cmc) 
悉 换 需要 一 定时 间 , 一 般 小 文件 2 秒 足 够 了 
time.slespC) 
答 出 转换 后 的 文本 ,前 200 个 字符 
with aqpen (bxt,encoding ="utf -8') as 外 : 
Print (fp.read (200)) 
Except: 
Fass 
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第 9 章 介 绍 了 文本 文件 和 二 进 制 文件 的 内 容 级 操作 ,本 章 重 点 介绍 文件 级 别 的 操作 ， 
例如 遍历 复制 .删除 .压缩 . 重 命 名 等 ,以 及 文件 与 文件 夹 操 作 在 系统 运 维 中 的 应 用 。 


10.1 os 模 块 


Python 标准 库 的 os 模块 除了 提供 使 用 操作 系统 功能 和 访问 文件 系统 的 简便 方法 之 
外 ,还 提供 了 大 量 文件 与 文件 夹 操作 的 方法 ,如 表 10-1 所 示 。 
表 10-1 os 模块 方法 






































方法 功能 说 明 
ee dd 测试 是 否 可 以 按照 mode 指定 的 权限 访问 文件 
chdir( path) 把 path 设 为 当前 工作 目录 

No tow wiis Tine) | 改变 文件 的 访问 权限 

nie 当前 文件 夹 

i 包含 系统 环境 变量 和 值 的 字典 

ley 当前 操作 系统 所 使 用 的 文件 扩展 名 分 隔 符 
et 返回 可 执行 文件 的 搜索 路 径 

getcwd( ) 返回 当前 工作 目录 

listdirCpath ) 返回 path 目录 下 的 文件 和 目录 列表 

mkdir( path[ , mode =0777] ) 创建 目录 ,要 求 上 级 目录 必须 存在 

We (PathlMPath2 …，mode = | 创建 多 级 目录 ,会 根据 需要 自动 创建 中 间 缺 失 的 目录 





open ( path, flags, mode = 00777, 


Eon) 按照 mode 指定 的 权限 打开 文件 ,默认 权限 为 可 读 、 可 写 、 可 执行 





popen( cmd, mode ='r', buffering = 
= 
rmdir( path) 删除 目录 ,目录 中 不 能 有 文件 或 子 文件 夹 


创建 进程 ,启动 外 部 程序 
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续 表 





方 ”法 


功能 说 明 





remove( path) 


删除 指定 的 文件 ,要 求 用 户 拥 有 删除 文件 的 权限 ,并 且 文 件 没有 
只 读 或 其 他 特殊 属性 





removedirs( pathl /path2…) 


删除 多 级 目录 ,目录 中 不 能 有 文件 





rename( sre, dst) 


重 命名 文件 或 目录 ,可 以 实现 文件 的 移动 , 若 目 标 文件 已 存在 则 
抛 出 异常 ,不 能 跨越 磁盘 或 分 区 





replace( old, new) 


重 命 名 文件 或 日 录 , 若 日 标 文件 已 存在 则 直接 覆盖 ,不 能 跨越 磁 
盘 或 分 区 





scandir( path =". ') 


返回 包含 指定 文件 夹 中 所 有 DirEntry 对 象 的 迁 代 对 象 ,遍历 文 
件 夹 时 比 listdir( ) 更 加 高 效 





sep 


当前 操作 系统 所 使 用 的 路 径 分 隔 符 





startfile( filepath [ , operation ] ) 


使 用 关联 的 应 用 程序 打开 指定 文件 或 启动 指定 应 用 程序 





stat( path) 


返回 文件 的 所 有 属性 





system( ) 


启动 外 部 程序 





truncate( path ，length ) 


将 文件 截断 ,只 保留 指定 长 度 的 内 容 





walk(top topdown = True ，onerror = 


None) 


遍历 目录 树 ,该 方法 返回 一 个 元 组 ,包括 3 个 元 素 : 所 有 路 径 名 、 
所 有 目录 列表 与 文件 列表 





write( fd, data) 





将 bytes 对 象 data 写 入 文件 弓 


下 面 通过 几 个 示例 来 演示 os 模块 的 基本 用 法 。 


>>>inport cs 
>>>inport os5.path 


>>>05.renanre ('C: Gg.tbt','D: \\test2.tt') #enare (0 可 以 实现 文件 的 改名 和 移动 
>>>[fneme for frame in os.listdir('.') \ 得 看 当前 文件 夹 中 指定 类 型 的 文件 
if fname.endswith(('.pyc', '-py',' -Pyw'))] 后 果 略 


>>>cs.getcwci() 凸 回 当前 的 工作 目录 
"csNNPython35， 

>>>os.mkcir (os.getcwd(0) +'NNbemp7) 覃 建 日 录 
>>>os.chcir(os.getcwa() +' \\tenp') 数 变 当前 工作 目录 
>>>cs.getcwd() 

'C:N\NEython35 \Xtenpy 


>>>os-nkcir(os.getcwq() +' \\test') 


>>>os.listdir(' .0 
['test'] 

>>>05.mdir ("test') 
>>>os.listdir(' .9) 

0 

>>>05.erviron.get (Path 
>>>inport time 


删除 日 录 


餐 取 系统 变量 path 的 值 


>>>time.strftime('%Y-sm-%dsH:sM:$s'， 壮 看 文件 创建 时 间 
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time.localtime (os-stat ('yilaizhim2 .py') .st_ctime)) 
"2016 -10 -18 15:58:57" 
>>>05.startfile (notepad.ee') 妨 动 记事 本 程序 


下 面 的 代码 使 用 os 模块 的 scandir( ) 输 出 当前 文件 夹 中 的 所 有 扩展 名 为 py 的 文件 。 


for entry in os.scandir() : 
if entry.is file and entry.name.endswith(' .py"'): 
Print (entry.name) 
如 果 需 要 遍历 指定 目录 下 所 有 子 目 录 和 文件 ,可 以 使 用 递归 的 方法 。 


fram os .path jmport join, isfile, isdir 


Gef 1istDirpepthFirst (directory) : 
""' 深 度 优先 遍历 文件 夹 '"'' 
妨 历 文件 夹 , 如 果 是 文件 就 直接 输出 
个 果 是 文件 夹 ,就 输出 显示 ,然后 递归 遍历 该 文件 夹 
for sibpath in listdir (directory) : 
Fath 一 join (directory, scpath) 
if isfile (path): 
Print (path) 
elif isdir (path) : 
Print (path) 
listDirpepthFirst (path) 
上 面 的 代码 使 用 深度 优先 的 遍历 方法 ,而 下 面 的 代码 则 使 用 了 广度 优先 遍历 方法 。 


fram os-Path irport join, isfile, isdir 


def 1istDirwiothEirst (directory) : 
"广度 优先 遍历 文件 夹 ''' 
梧 用 列表 模拟 双 端 队列 ,效率 稍微 受 影响 ,不 过 关系 不 大 
dirs =[directory] 
着 果 还 有 没 遍 历 过 的 文件 夹 ,继续 循环 
while dirs: 
网 历 还 没 遍历 过 的 第 一 项 
Current =dirs.pop(0) 
妨 历 该 文件 夹 ,如 果 是 文件 就 直接 输出 显示 
茹 I 果 是 文件 夹 ,输出 显示 后 ,标记 为 待 遍 历 项 
for sibPath in listdir (Current): 
path =join (current,sibeatb) 
if isfile (path) : 
Print (path) 
elif isdir (path) : 
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print (path) 
dirs.aapend (path) 
或 者 ,也 可 以 使 用 os 模块 的 walk( ) 方 法 进行 指定 文件 夹 内 容 的 遍历 。 


if not os.path.isdir (ath) : 
Print ('Error:"'vPath '" is not a directory cr dbes not exist.') 


retim 
list dirs=0s.walk (cath) 
for root,dirs, files in list dirs: 妨 历 该 元 组 的 日 录 和 文件 信息 


for d in dirs: 
print (cs.path.join(root,)) ”做 取 完整 路 径 
for f in files: 
Print (os.path.join(root, 了 D) ”页 取 文件 的 绝对 路 径 


Visitpir('h: \usic') 


也 可 以 使 用 10. 4. 1 节 介 绍 的 glob 模块 提供 的 功能 实现 类 似 功 能 。 另 外 ,函数 
walk( ) 的 参数 topdown 默认 值 为 True ,表示 从 上 至 下 人 遍历。 在 使 用 rmdir( ) 删除 文件 夹 时 
要 求 文件 夹 必须 为 空 ,所 以 在 递归 删除 指定 文件 夹 中 所 有 内 容 时 应 从 下 往 上 进行 删除 ,此 
时 可 以 将 参数 topdown 设置 为 False。 下 面 的 代码 可 以 删除 文件 夹 test 中 的 所 有 文件 和 子 


文件 夹 ,前 提 是 不 存在 符号 链接 或 具有 只 读 属性 的 文件 或 子 文件 夹 。 
irport os 
for roct,dirs, files in o6.walk('test', topdown =False) : 
for nare in files: 
C5.remwe (05 .path.join (roct,nare) ) 
for name in dirs: 
os5.mdir (os.path.join (roct, name)) 


10.2 os. path 模块 


os. path 模块 提供 了 大 量 用 于 路 径 判 断 、 切 分 .连接 以 及 文件 夹 遍历 的 方法 ,如 表 10-2 

















所 示 。 
表 10-2 os. path 模块 方法 
方 法 功能 说 明 
abspath( path ) 返回 给 定 路 径 的 绝对 路 径 
basename( path) 返回 指定 路 径 的 最 后 一 个 组 成 部 分 
commonpath( paths) 返回 给 定 的 多 个 路 径 的 最 长 公共 路 径 

































































>>>Fpath="'D: \\ryPythan ep \\new test.txt' 
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续 表 
方 法 功能 说 明 
commonprefix( paths ) 返回 给 定 的 多 个 路 径 的 最 长 公共 前 缀 
dimame( p) 返回 给 定 路 径 的 文件 夹 部 分 
nista( path) 判断 文件 是 否 存 在 
getatime ( filename ) 返回 文件 的 最 后 访问 时 间 
getctime( filename ) 返回 文件 的 创建 时 间 
getmtime( filename ) 返回 文件 的 最 后 修改 时 间 
getsize( filename ) 返回 文件 的 大 小 
isabs( path) 判断 path 是 否 为 绝对 路 径 
isdir( path ) 判断 path 是 否 为 文件 夹 
isfile( path ) 判断 path 是 否 为 文件 
join( path paths ) 连接 两 个 或 多 个 path 
realpath( path ) 返回 给 定 路 径 的 绝对 路 径 
relpath( path) 返回 给 定 路 径 的 相对 路 径 , 不 能 跨越 磁盘 驱动 器 或 分 区 
samefile(f1, {2) 测试 fl 和 亿 这 两 个 路 径 是 否 引 用 同一 个 文件 
split( path ) 以 路 径 中 的 最 后 一 个 斜 线 为 分 隔 符 把 路 径 分 隔 成 两 部 分 ,以 列表 形式 返回 
splitext( path ) 从 路 径 中 分 隔 文件 的 扩展 名 
splitdrive( path ) 从 路 径 中 分 隔 驱 动 器 的 名 称 


>>>05.path.dimame (path) 白 回 路 径 的 文件 夹 名 
iD:Nwwpythcn exp， 

>>>05.path.basename (patih) 上 贩 回 路 径 的 最 后 一 个 组 成 部 分 
rnew test.tit! 

>>>05.path.split (path) 制 分 文件 路 径 和 文件 名 

0°D: \ ypython ep', new test.bt') 

>>>05.path.split ('') 制 | 分 结果 为 空 字符 串 


GO) 


>>>05.path.split ('C: \\windows') 


各 最 后 一 个 斜 线 为 分 隔 符 


('C: \\', windows') 
>>>05.path.split ('C: \\Wwindows\\') 
('C: \\Windows', '') 


>>>cs.Fath-splitdrive (path) 制 ] 分 驱动 器 符号 
('D:',' \\rypython ep \\new test.txt') 
>>>05.path. splitest (path) 制 分 文件 扩展 名 


(D:N\Nmpython ep \\pew test', -bt 
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>>>05 .path.ormmorpath ([r'C: \WWindows \notepad.ee',r'C: \Windows \system']) 


‘C:\Windows' 

>>>05.path.ommorpath([r'ab\c\d' rialb\c\e']) 版 回路 径 中 的 共同 部 分 
"abNe' 

>>>cs.Fath.comcnprefix([r'aVpevdvr'apee']) 版 回 字 符 串 的 最 长 公共 前 缀 
"abN\eN\Y 

>>>05.path.realpath ('tttt.py') 版 回绝 对 路 径 
"CN\NEYython 3.5\NEttE-PY" 

>>>05.path.abepath ('tttt.py') 版 回绝 对 路 径 
'C:NNEython 3.5\\tttt.py' 

>>>05.path.relpath('C: \\windows\\notepad.ee') ”上 央 回 相对 路 径 
Wincows \\notepad.ee' 


>>>05.path.relpath('D: \\windows \\notepad.exe') 相对 路 径 不 能 跨越 分 区 

ValusError: Path js cn mount 'D:',start cn mount 'C:" 

>>>05.path.relpath('C: \\windows \\notepad.ee', 'dl1s') 糙 定 相对 路 径 的 基准 位 置 
NWindows \ \notepad.ee' 


10.3 shutil 模块 


shutil 模块 也 提供 了 大 量 的 方法 支持 文件 和 文件 夹 操 作 , 常 用 方法 如 表 10-3 所 示 。 
表 10-3 shutil 模块 常用 方法 











方 法 功能 说 明 
复制 文件 ,新 文件 具有 同样 的 文件 属性 ,如 果 目 标 文件 已 存在 则 
copy(src，dst) 抛 出 异常 
本 复制 文件 ,新 文件 具有 原文 件 完全 一 样 的 属性 ,包括 创建 时 间 、 
Oe 修改 时 间 和 最 后 访问 时 间 等 ,如 果 目 标 文件 已 存在 则 抛 出 异常 
copyfile( sre, dst) 复制 文件 ,不 复制 文件 属性 ,如 果 日 标 文件 已 存在 则 直接 往 盖 





在 两 个 文件 对 象 之 间 复 制 数 据 ,例如 
copyfileobj( open( 123. txt') , open( 456. txt', a') ) 


把 sre 的 模式 位 (mode bit) 复制 到 dst 上 ,之 后 两 者 具有 相同 的 


copyfileobj( fsre, fdst) 




















copymode( sre, dst) 模式 

copystat( sre, dst) 把 sre 的 模式 位 .访问 时 间 等 所 有 状态 都 复制 到 dst 上 
copytree( sre, dst) 递归 复制 文件 夹 

disk_usage( path) 查看 磁盘 使 用 情况 

move( sre, dst) 移动 文件 或 递归 移动 文件 夹 ,也 可 以 给 文件 和 文件 夹 重 命名 
rmtree( path) 递归 删除 文件 夹 





make_ archive ( base _ name, format, 创建 TAR 或 ZIP 格式 的 压缩 文件 


root_dir = None, base_dir = None) 





unpack_archive( filename, extract_dir 解压 缩 压缩 文件 


= None, format = None) 
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下 面 的 代码 演示 了 如 何 使 用 标准 库 shutil 的 copyfile( ) 方 法 复制 文件 : 

>>>import shutil 本 和 人 snmtil 模 块 

>>>shutil .copyfile(c: dir.txt','C: dirl.txt') 复制 文件 

下 面 的 代码 将 C:\Python35\Dlls 文件 夹 以 及 该 文件 夹 中 所 有 文件 压缩 至 D: \a. zip 
奖 种 s 

>>>shutil .make arhive('D: \\a', 'zip', 'C: \\Python35', 'DIs') 

'D: \\a.zip' 

下 面 的 代码 将 刚 压缩 得 到 的 文件 D:\a. zip 解压 缩 至 D:\a_unpack 文件 夹 : 

>>>sHutil .urpack archive('D: \\a.zip', 'D: \\a_urpack') 

下 面 的 代码 使 用 shutil 模块 的 方法 删除 刚刚 解压 缩 得 到 的 文件 夹 : 

>>>shutil .mtree ('D: \\a_urpack') 


Python 标准 库 shutil 的 rmtree( ) 函数 还 支持 更 多 的 参数 ,例如 ,可 以 使 用 onerror 参数 
指定 回调 函数 来 处 理 删 除 文件 或 文件 夹 失败 的 情况 : 


>>>inport cs 
>>>inport stat 
>>>inport shutil 
>>>aef remwe reacinly (finc,path, ): 证 义 回调 函数 
cs.chmod(path, stat.S_IJARITTE) 删除 文件 的 只 读 属性 
fimc (path) 本 次 执行 删除 操作 
>>>shutil .mtree ('D: \\Ges_test') 彼 件 夹 中 有 个 只 读 文件 ,删除 失败 


EermissicnError: [WirError 5] 拒绝 访问 。: 'D: \\Ges_test\\testl.txt' 

>>>shutil .mtree ('D: \\Ges_test', merror remve TeacomyY) 

精 定 回调 函数 ,删除 成 功 

下 面 的 代码 使 用 shutil 的 copytree( ) 函数 递归 复制 文件 夹 , 并 忽略 扩展 名 为 pye 的 文 
件 和 以 “新 " 字 开 头 的 文件 及 子 文件 夹 : 

>>>fram shutil jnmport opytres, ignore pattems 

>>>copytree ('C: \\python35 \ \test', 'D: \\Ges_test', 

jignore =ignore pattems('* .pyc', "新 * ')) 


10.4 其 他 常用 模块 
1041 gob 模块 
Python 标准 库 glob 也 提供 了 一 些 与 文件 搜索 或 遍历 有 关 的 函数 ,并 且 人 允许 使 用 命令 


行 的 通配符 进行 模糊 搜索 ,更 加 方便 灵活。 本 节 主 要 通过 几 个 示例 代码 来 演示 glob 模 
块 的 功能 , 略 去 了 输出 结果 ,请 自行 验证 。 
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>>>inport glGb 
>>>glcb.glab('*bt) 版 回 当前 文件 夹 中 所 有 扩展 名 为 txt 的 文件 列表 
>>>glab-glab("?. *) 版 回 主 文件 名 只 有 一 个 字符 或 数字 的 文件 列表 
>>>glcb.glcb('[123abc] *.txt') 稻 回 当前 文件 夹 中 以 1,2、3.ab.c 

入 几 个 字母 开头 的 .tt 文件 列表 
>>>glcb.glcb('[!123abc] *txt') 艇 回 当前 文件 夹 中 不 以 1、2.3.a.b,c 

咎 任意 一 个 字母 开头 的 .bt 文件 列表 
>>>glGb.glGb('C:\Yython 3.5\\*. *) 

贩 回 c:\Yythcn 3.5 文 件 夹 中 所 有 文件 列表 
>>>glab.iglab('c:\Yeython 3.5\\* *) 

版 回 包含 指定 文件 夹 中 所 有 文件 的 生成 器 对 象 
>>>gldb.gldb('tools\N*eN\N\% tvIecursive =True) 

姨 归 查找 tcols 文 件 夹 中 所 有 .txt 文件 
>>>glGb. mistdir('. 7) 姨 归 遍历 当前 文件 夹 中 所 有 文件 ,返回 生成 器 对 象 
>>>glcb.glcbl (dlls' '*EPyd') 版 回 指定 文件 夹 中 指定 类 型 的 文件 列表 
>>>for i in gldb.glche ('tools' ' **): 

Erint (i) 鼠 归 遍历 tcols 文 件 夹 所 有 文件 


1042 fnmatch 模块 


Python 标准 库 fnmatch 提供 了 文件 名 的 检查 功能 ,支持 通配符 的 使 用 ,其 中 通配符 * 
可 以 匹配 任意 字符 ,“?" 可 以 匹配 任何 单个 字符 ,[seq] 可 以 匹配 seq 中 的 任何 字符 ， 
[1seq] 可 以 匹配 任何 不 属于 seq 的 字符 。 

标准 库 fnmatch 提供 的 fnmatch( filename ，pattern ) 函数 用 来 检查 文件 名 flename 是 否 
与 模式 pattern 相 匹 配 , 返 回 True 或 False;fnmatchcase (filename，pattern ) 完成 相似 的 功 
能 ,区 别 在 于 该 函数 区 分 大 小 写 。 


>>>inport frratch 

>>>frmatdh. frmatah (r'C: wincows \notepad .ese', ' *.exe') 
True 

>>>frmatdh. frmratah (r'C: \Windows \notepad .exe', '?????7? .exe') 
False 

>>>frmatdh.frmratdh (r'notepad.exe', ' *.exe') 
True 

>>>frmatdh.frmatah (r'notepad.exe', 222?222?2.exE7) 

True 

>>>frmatdh. frmratchcase (TInoteped.exe' 323222222.G5E 7 ) 
False 

>>>frmatdh.frmratchcase (r'notepad.exe', '?2322???.exe') 
True 


标准 库 fnmatch 提供 的 filter(names ,pattern ) 函数 用 来 返回 names 中 符合 pattern 的 那 
部 分 元 素 构成 的 列表 ,等 价 于 [n for n in names if fnmatch(n， pattern) ] ,但 效率 更 高 。 
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>>>frmatah.filter (os.1listdir('.'),' *py') 站 前 文件 夹 中 的 所 有 .py 文件 
10.5 精彩 案例 赏析 


示例 10-1 把 指定 文件 夹 中 的 所 有 文件 名 批量 随机 化 ,保持 文件 类 型 不 变 。 
fram string inport ascii letters 

fram cs jimport listdir, rename 

fram cs.Path import splitext, join 

fram rancom inrport doioe, randint 


Gef randarFEilename (directory) : 
fr fn in listdir (Girectory) : 
制 分 ,得 到 文件 名 和 扩展 名 
memev ext =splitext (Im) 
n=randint (5,20) 
寿 成 随机 字符 串 作为 新 文件 名 
mewNEme ="' .join ((choice (ascii letters) for i in range (n))) 
政 改 文件 名 
Tenere (join (directory, fn) ,join (directory, newNeme +ext)) 


randoarEilename ('C: \\test') 
示例 10-2 计算 文件 的 CRC32 值 和 MD5 值 。 


if o5.path.isfile (filenere): 
with apen (filenare, "1b') as fp: 
contents -fp.read() 
Tetumm (zlib.crc32 (Contents) ,hashlib.mc5 (conbents) .hexdigest ()) 
else: 
Frint ('file not exists') 


Print (crc3omc5 ("tttt py")) 

示例 10-3 ”编写 程序 ,进行 文件 夹 增 量 备份 。 

程序 功能 与 用 法 : 指定 源 文 件 夹 与 目标 文件 夹 , 自 动 检测 自 上 次 备份 以 来 源 文件 夹 
中 内 容 的 改变 ,包括 修改 的 文件 .新建 的 文件 .新 建 的 文件 夹 等 ,自动 复制 新 增 或 修改 过 的 
文件 到 目标 文件 夹 中 , 自 上 次 备份 以 来 没有 修改 过 的 文件 将 被 忽略 而 不 复制 ,从 而 实现 增 
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量 备份 。 本 例 属 于 系统 运 维 的 范畴 。 
inport os 
inport 五 jecmp 
jimport shutil 
jmport sys 


Gef autopacap (scrpirvdstDir) : 
if (et cs-Path.isdir(scrpir)) or (not os.path.isdir (GstDir)) or 
(05.path.abspath (scrpir) ! =scrpir) or 
(05 .path.abspath (dstDir) ! =dstDir)) : 
Usage (0 
for item in cs.listdir(scrpir) : 
ScrTtem=os.Fath.join(scrpir,item 
GstItem=scrItem.replace (scrDir,dstDir) 
if 0o5.path.isdir (scrTItem) : 
枪 | 建 新 增 的 文件 夹 ,保证 目标 文件 夹 的 结构 与 原始 文件 夹 一 致 
if not o5.path.exists (dstItem : 
cs .mkedirs (dstItem) 
Print (elke directory' +dstTtem) 
婵 归 调 用 自身 函数 
atcpacap (scrItem, dstTbem) 
elif os.path.isfile (scrTtbem) : 
可 复制 新 增 或 修改 过 的 文件 
if ((not os5.path.exists (GstTbem ) or 
(nect fileamp.amp (scrTbem dstTbem shallow =False))): 
Shutil .opyfile (scrItem, GstTItem) 
Print ('file:' +scrItem+' ==>" +dstItem) 


GEf usage () : 
Print ('scrpir and dstDir mst be existing abeolute Path of Certain directory') 
Print ('For exanple: {0} c: \\plddir c: \\newdir' .fomat (sys.argv[0])) 


Sys.exit (0) 
if_ nme _==' main _': 
if len(sys.argv) ! 3: 
usage() 
ScrDir, dstDir =sys.argv[1],sys.argv[2] 
atcPEackp (scrDir, dstDir) 


示例 104 编写 程序 ,统计 指定 文件 夹 大 小 以 及 文件 和 子 文件 夹 数量 。 本 例 也 属于 
系统 运 维 范畴 ,可 用 于 磁盘 配额 的 计算 ,例如 E-mail .博客 .FTP ,\ 快 盘 等 系统 中 每 个 账号 所 
空间 大 小 的 统计 。 


inport os 
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for lists in os.1istdir (path) : 
Sb path =05.path.join (path, lists) 
证 os.path.isfile (sb path): 
fileNm-fileNm1 统计 文件 数量 
totalsize =totalsize +os.Path.getsize (sip_ path) 琉 计 文件 总 大 小 
elif os.path.isdir (sub path): 
dimm-dimm 计 级 计 文件 夹 数量 
visithir (sb path) 姨 归 遍历 子 文件 夹 


def main (path) : 
if not 05.path.isdir (path) : 
Print ('Error:"',path, '" is not a directory or cbes not exist.') 
retim 


GEf sizecorvert (size) : 辜 位 换算 
KM,G 忆 024,1024* * 2,1024* 六 3 
if size >=G: 
retim str (size/G) +'G Bytes' 
elif size >-M: 
retim str (size/M) +'M Bytes' 
elif size >3¥: 
retim str (size/K) +'K Bytes' 
else: 
retim str (size) +'Bytes' 


Sef output (eath) : 
Print ("The total size of ' rath +' is:' +sizeconvert (totalsize) +' (' +str (totalsize) +' Bytes) ') 
print ("The total rnber of files in ' tpath+"' is:',fileNm) 
print ("The total nmber of directories in ' path+' is:"',dirNm) 





示例 10-5 ”编写 程序 ,递归 删除 指定 文件 夹 中 指定 类 型 的 文件 和 大 小 为 0 的 文件 。 
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fram os .path inport isdir,join,splitest 
fram os import rerove, listdir, drod, stat 


filetypes =(' .trp',' .10g',' .dbj',' .bt') 盱 定 要 删除 的 文件 类 型 
GEf delcertainFiles (directory) : 
if not isdir (directory) : 
Tetmm 
for 五 leneare in listdir (Hirectory) : 
tenp =join (directory, filename) 
if isdir (tenp) : 
GelcertainFiles (terp) 赃 归 调用 
elif splitext (tenp) [1] in filetypes or stat (tenp) .st size=0: 
God (tienp, 00777) 赣 改 文件 属性 ,获取 删除 权限 
Temove (tenp) 删除 文件 


Print (terp, ' deleted……') 


eloartainFiles (r'C: \test') 


第 11 * 
帮 代码 质量 保障 : 异常 处 理 结 
”′ ， 构 .程序 调试 与 测试 





程序 出 错 是 一 件 非常 难 避 免 的 事情 。 再 厉害 的 程序 员 也 无 法 提前 预见 代码 运行 时 可 
能 会 遇 到 的 所 有 情况 ,几乎 每 个 程序 员 都 被 用 户 说 过 “你 编 的 那个 软件 不 好 用 啊 ”, 而 程 
序 员 经 过 反复 检查 以 后 发 现 问题 的 原因 是 用 户 操作 不 规范 或 者 输入 了 错误 类 型 的 数据 ， 
于 是 一 边 修改 代码 加 强 类 型 检查 一 边 抱怨 用 户 不 按 套路 出 牌 。 其 实 呢 , 作 者 个 人 认为 这 
样 的 问题 的 根源 还 是 在 程序 员 而 不 在 用 户 ,程序 员 编写 代码 时 有 义务 也 有 必要 考虑 这 些 
特殊 情况 ,因为 大 多 时 候 恰 恰 是 少数 特殊 情况 影响 了 整个 系统 的 美感 和 开发 人 员 的 成 就 
感 (二 八 定 律 ) 。 虽 然 大 部 分 软件 在 发 布 前 一 般 都 经 过 了 严格 的 测试 ,然而 再 充分 的 测试 
也 很 难 枚 举 所 有 可 能 出 现 的 情况 ,这 时 候 异 常 处 理 结构 则 是 避免 特殊 情况 下 软件 崩溃 的 
利器 。 

异常 是 指 程序 运行 时 引发 的 错误 ,引发 错误 的 原因 有 很 多 ,例如 除 零 . 下 标 越 界 文件 
不 存在 网络 异常 等 。 如 果 这 些 错 误 得 不 到 正确 的 处 理 将 会 导致 程序 崩溃 并 终止 运行 , 合 
理 地 使 用 异常 处 理 结构 可 以 使 得 程序 更 加 健壮 ,具有 更 高 的 容错 性 ,不 会 因为 用 户 不 小 心 
的 错误 输入 而 造成 程序 崩溃 ,也 可 以 使 用 异常 处 理 结构 为 用 户 提供 更 加 友好 的 提示 。 另 
外 ,有 效 的 软件 测试 方法 能 够 在 软件 发 布 之 前 发 现 尽 可 能 多 的 bug ,而 软件 发 布 之 后 再 出 
现 错误 时 是 否 能 够 调试 程序 并 快速 定位 和 解决 存在 的 问题 则 是 程序 员 综合 水 平和 能 力 的 
重要 体现 。 





11.1 异常 处 理 结构 


11114 异常 的 概念 与 表现 形式 


当 程 序 执行 过 程 中 出 现 错误 时 Python 会 自动 引发 异常 ,程序 员 也 可 以 通过 raise 语句 
显 式 地 引发 异常 。 异 常 处 理 是 因为 程序 执行 过 程 中 由 于 输入 不 合法 导致 程序 出 错 而 在 正 
常 控制 流 之 外 采取 的 行为 。 严 格 来 说 ,语法 错误 和 逻辑 错误 不 属于 异常 ,但 有 些 语法 错误 
往往 会 导致 异常 ,例如 ,由 于 大 小 写 拼写 错误 而 试图 访问 不 存在 的 对 象 ,或 者 试图 访问 不 
存在 的 文件 ,等 。 当 Python 检测 到 一 个 错误 时 ,解释 器 就 会 指出 当前 程序 流 已 经 无 法 再 
继续 执行 下 去 ,这 时 候 就 出 现 了 异常 。 代 码 一 旦 抛 出 异常 而 得 不 到 及 时 的 处 理 , 整 个 程序 
就 会 崩溃 而 提前 结束 ,而 合理 地 使 用 异常 处 理 结 构 可 以 使 得 程序 更 加 健壮 ,具有 更 高 的 
容错 性 ,不 会 因为 用 户 不 小 心 的 错误 输入 而 造成 程序 终止 ,也 可 以 使 用 异常 处 理 结构 为 用 
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户 提供 更 加 友好 的 提示 。 
在 前 面 的 章节 中 已 经 多 次 出 现 过 异常 ,想必 大 家 已 经 有 了 初步 的 了 解 。 下 面 是 几 种 
比较 常见 的 异常 的 表现 形式 : 
>>>2 /0 失 0 错误 
ZercDivisiorError: divisicn by Zero 
>>>'a' 二 肯 作 数 类 型 不 支持 , 略 去 异常 的 详细 信息 
TypeError: Can't convert 'int' abject to str implicitly 
>>>{3,4,5} 号 娩 作 数 类 型 不 支持 
TypeError: nsupported qperand type (s) for* : "set' and "int' 
>>>print (teststr) 羔 量 名 不 存在 
RNEmePrror: name 'teststr' is not defined 
>>> 印 =pen(r'D: Nbest.data' pb) 信件 不 存在 
HileNptEbuncError: [Ermp 2] Nb such file or directory: 'D: \\test.data' 
>>>lenG) 惨 数 类 型 不 匹配 
TypeError: doject of type 'int' has np len() 
>>>1ist (3) 惨 数 类 型 不 匹配 


TYPsError: 'int' doject is not iterable 


1112 Phthm 内 置 异常 类 层次 结构 


下 面 全 面 展 示 了 Python 内 置 异常 类 的 继承 层次 ,其 中 BaseException 是 所 有 内 置 异常 
类 的 基 类 。 在 使 用 异常 处 理 结构 捕获 和 处 理 异常 时 ,应 尽量 具体 一 点 ,最 好 是 明确 指定 要 
捕获 和 处 理 哪 一 类 异常 。 建 议 先 尝试 捕获 派生 类 ,然后 再 捕获 基 类 ,应 尽量 避免 直接 捕获 


Exception 或 BaseException 。 
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1113 异常 处 理 结构 


Python 提供 了 多 种 不 同形 式 的 异常 处 理 结构 ,基本 思路 都 是 一 致 的 : 先 尝试 运行 代 
码 , 如 果 没 有 问题 就 正常 执行 ,如 果 发 生 了 错误 就 尝试 着 去 捕获 和 人 处理 ,最 后 实在 没 办 法 
了 才 崩 演 。 从 这 个 角度 来 看 ,不 同形 式 的 异常 处 理 结构 也 属于 选择 结构 的 变形 。 


1. try:…except:… 


Python 异常 处 理 结构 中 最 简单 的 形式 是 try…except… 结 构 , 类 似 于 单 分 支 选 择 结构 。 
其 中 try 子 句 中 的 代码 块 包含 可 能 会 引发 异常 的 语句 ,而 except 子 句 则 用 来 捕 提 相应 的 异 
常 。 如 果 try 子 句 中 的 代码 引发 异常 并 被 except 子 句 捕 提 ,就 执行 except 子 句 的 代码 块 ; 
如 果 try 中 的 代码 块 没 有 出 现 异常 就 继续 往 下 执行 异常 处 理 结构 后 面 的 代码 ;如 果 出 现 异 
常 但 没有 被 except 捕获 ,继续 往外 层 抛 出 ;如 果 所 有 层 都 没有 捕获 并 处 理 该 异常 ,程序 崩 
省 并 将 该 异常 呈现 给 最 终 用 户 。 该 结构 语法 如 下 : 

try: 

厢 能 会 引发 异常 的 代码 , 先 执行 一 下 试 试 

except Exosptian[ as Teascn] : 

车 果 try 中 的 代码 抛 出 异常 并 被 excspt 捕 提 , 就 执行 这 里 的 代码 

下 面 的 代码 用 来 接收 用 户 输入 ,并 且 要 求 用 户 必 须 输入 整数 ,不 接收 其 他 类 型 的 
输入 。 

>>>wihile True: 

x=irpt ('Please irpt:') 
try: 
x=int (x) 
Print ('You have irput {0}' .fonmrat (x)) 
break 
ExcePE Excepticn as e: 
print ('Error. ') 


Please irput:234c 
Error. 

Please irput:5 
You have irput 5 


2。try…except…else…- 


带 有 else 子 句 的 异常 处 理 结构 可 以 看 作 是 一 种 特殊 的 双 分 支 选 择 结构 ,如 果 try 中 的 
代码 抛 出 了 异常 并 且 被 except 语句 捕捉 则 执行 相应 的 异常 处 理 代码 ,这 种 情况 下 就 不 会 
执行 else 中 的 代码 ;如 果 try 中 的 代码 没有 引发 异常 , 则 执行 else 块 的 代码 。 该 结构 的 语 
法 如 下 : 
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try: 
条 能 会 引发 异常 的 代码 
except Ecoepticn [ as reasan] : 
胡来 处 理 异常 的 代码 
else: 
着 果 try 子 句 中 的 代码 没有 引发 异常 ,就 继续 执行 这 里 的 代码 
例如 ,前 面 要 求 用 户 必须 输入 整数 的 代码 也 可 以 像 这 样 写 ,并 且 这 是 推荐 的 写法 。 也 
就 是 说 ,不 要 把 太 多 代码 放 在 try 中 ,而 是 应 该 只 放 真 的 可 能 会 引发 异常 的 代码 。 


>>>wibhile True: 
x=irput ('Please irput:') 
try: 


Print ('You have irput {0}' .fomrat (x)) 
break 


Please irpt:888c 
Error. 

Please imput:888 
You have irput 888 


3. try…except…finally… 


在 这 种 结构 中 ,无 论 try 中 的 代码 是 否 发 生 异 常 ,也 不 管 抛 出 的 异常 有 没有 被 except 
语句 捕获 ,finally 子 句 中 的 代码 总 是 会 得 到 执行 。 因 此 ,finally 中 的 代码 常用 来 做 一 些 清 
理工 作 ,例如 释放 try 子 句 中 代码 申请 的 资源 。 该 结构 语法 为 


朵 能 会 引发 异常 的 代码 
except Excepticn [ as reasan]: 
扑 理 异常 的 代码 
人 inally: 
碟 论 try 子 句 中 的 代码 是 否 引 发 异常 ,都 会 执行 这 里 的 代码 
例如 下 面 的 代码 ,不论 是 否 发 生 异 常 ,finally 子 句 中 的 代码 总 是 被 执行 。 


>>>aef div (a,b) : 

try: 
Print ab) 

except ZeroDivjsicnError: 
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print (11) 


>>>div GB3,5) 

0.6 

7 

>>>div (3,0) 

The second parameter cannot be 0. 

be 

如 果 try 子 句 中 的 异常 没有 被 except 语句 捕捉 和 处 理 , 或 者 except 子 句 或 else 子 句 中 
的 代码 抛 出 了 异常 ,那么 这 些 异 常 将 会 在 finally 子 句 执行 完 后 再 次 抛 出 。 


>>>Gef div(arb) : 
try: 
Print (a/p) 
Eoept ZercDivisionError: 
Print ("The seccna parameter carnot be 0.') 
finally: 
print (1) 


>>>div('3',5) 

= 

此 处 略 去 异常 的 详细 信息 ) 

TypeError: unsupported qperand type (s) for /: 'str' and 'int" 

需要 注意 的 是 ,异常 处 理 结构 不 是 万 能 的 ,并 不 是 采用 了 异常 处 理 结 构 就 万 事 大 吉 ， 
finally 子 句 中 的 代码 也 可 能 会 引发 异常 。 下 面 代码 的 本 意 是 使 用 finally 子 句 来 避免 文件 
对 象 没有 关闭 的 情况 发 生 ,但 是 由 于 指定 的 文件 不 存在 而 导致 打开 失败 ,结果 在 finally 子 
句 中 关闭 文件 时 引发 了 异常 ,因为 这 时 并 不 存在 文件 对 象 f1。 


>>>try: 


f1 -pen('testl .tt', 'r') 下 件 不 存在 , 抛 出 异常 ,不 会 创建 文件 对 象 也 
line =f1 .readline( ) 眶 面 的 代码 不 会 被 执行 
Print Qine) 
except SyntaxError: 之 个 ecset 并 不 能 捕捉 上 面 的 异常 
Print ('sth wrong') 
finally: 
f1.close() 组 不 存在 ,再 次 引发 异常 


FileNptpoundEerror: [Ermo 2] WD such file or directory: 'test1.tixt' 

During handling of the above eeptin, another expeption occurred 

NameRrror: name 'fl' is no defined 

如 果 在 函数 中 使 用 异常 处 理 结构 ,尽量 不 要 在 finally 子 句 中 使 用 return 语句 ,以 免 发 
生 非 常 难以 发 现 的 逻辑 错误 。 例 如 下 面 的 代码 ,不管 参 数 是 否 符合 函数 要 求 ,调用 函数 时 
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都 得 到 了 同样 的 错误 信息 ,因为 finally 子 句 中 的 代码 总 是 会 执行 的 。 


>>>Gef div (a,b): 
try: 
IEbmm ab 
except ZercDivisionError: 
TeEtbmm 'The seconq parameter ceannot be 0." 
finally: 
retum "Error'" 


>>>div (3,5) 
"Error' 
>>>div('3',5) 
"Error' 
>>>div (3,0) 
"Error' 


4. 可 以 捕捉 多 种 异常 的 异常 处 理 结构 


在 实际 开发 中 ,同一 段 代码 可 能 会 抛 出 多 种 异常 ,并 且 需 要 针对 不 同 的 异常 类 型 进行 
相应 的 处 理 。 为 了 支持 多 种 异常 的 捕捉 和 处 理 ,Python 提供 了 带 有 多 个 except 的 异常 处 
理 结构 ,一旦 try 子 句 中 的 代码 抛 出 了 异常 ,就 按 顺序 依次 检查 与 哪 一 个 except 于 句 匹 配 ， 
如 果 某 个 except 捕捉 到 了 异常 ,其 他 的 except 子 句 将 不 会 再 尝试 捕捉 异常 。 该 结构 类 似 
于 多 分 支 选择 结构 ,语法 格式 为 

try: 

朵 能 会 引发 异常 的 代码 
Exoept Exosptionl : 

由 理 异常 类 型 1 的 代码 
Exopt Exosption?: 

椒 理 异常 类 型 2 的 代码 
Except Exosption3: 

椒 理 异常 类 型 3 的 代码 


下 面 的 代码 演示 了 这 种 异常 处 理 结构 的 用 法 ,连续 运行 3 次 并 输入 不 同 的 数据 ,结果 
如 下 : 
>>>try: 
x=cat (inprt(" 请 输入 被 除数 : )) 
y=oat (inpt(" 请 输入 除数 : )) 
z=x/y 
except ZercDivisionError: 
print ("除数 不 能 为 零 ') 
except TypeError: 
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print ("被 除数 和 除数 应 为 数值 类 型 ') 
exept NEmeError: 

print ("变量 不 存在 ') 
else: 

Print bx "/',y,' =",2) 


请 输入 被 除数 : 30 第 一 次 运行 
请 输入 除数 : 5 
30.0/5.0=6.0 


请 输入 被 除数 : 30 第 二 次 运行 , 略 去 重复 代码 
请 输入 除数 : ac 
ValueError: oould not ccorvert string to float: 'abc' 


请 输入 被 除数 : 30 第 三 次 运行 , 略 去 重复 代码 

请 输入 除数 : 0 

除数 不 能 为 零 

在 实际 开发 中 ,有 时 候 可 能 会 为 几 种 不 同 的 异常 设计 相同 的 异常 处 理 代码 (虽然 这 
种 情况 很 少 ) 。 为 了 减少 代码 量 ,Python 允许 把 多 个 异常 类 型 放 到 一 个 元 组 中 ,然后 使 用 
一 个 except 子 句 同 时 捕捉 多 种 异常 ,并且 共 用 同一 段 异 常 处 理 代码 。 


>>>try: 
x=oat (input(' 请 输入 被 除数 : ')) 
Y= 人 oat (input ("请 输入 除数 : ')) 
z=float (0)/y 
except (ZeroDivisicornError, TypeError, NameError) : 
Frint ("捕捉 到 了 异常 ') 
else: 
Print Ge, /y=",2) 


请 输入 被 除数 : 30 
请 输入 除数 : 0 
捕 提 到 了 异常 


5. 同时 包含 else 子 句 .finally 子 句 和 多 个 except 子 句 的 异常 处 理 结构 
Python 异常 处 理 结构 中 可 以 同时 包含 else 子 句 .多 个 except 子 句 和 finally 子 句 。 例 如 : 


>>>0ef div (Gy) : 
try: 
Print (x/y) 
Eoept ZercDivisionError: 
Print ('ZercDivisionError') 
except TYPEError: 
Print (TYpearror) 
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else: 
Print ("ND Error') 
finally: 
print ("executing finally clause") 
>>>div 3,5) 
0.6 


1114 断言 与 上 下 文 管理 语句 


断言 语句 assert 也 是 一 种 比较 常用 的 技术 ,常用 来 在 程序 的 某 个 位 置 确认 某 个 条 件 
必须 满足 。 断 言语 句 assert 仅 当 脚本 的 _debug_ 属性 值 为 True 时 有 效 ,一 般 只 在 开发 和 
测试 阶段 使 用 。 当 使 用 优化 选项 -0 或 -00 把 Python 程序 编译 为 字 节 码 文件 时 ,assert 语 
句 将 被 删除 。 

>>>a 二 
>> 加 二 
>>>assert a==, 'a mst be eqal tob' 


AssertiarError: a must be eqal tob 
>>>try: 

assert a==b, 'a mst be eqal tob' 
except RsserticnError as reasan: 


Print ('%s:%s'% (reasn. _class_ _name _,reasan)) 


RsserticnError:a mst be equal to b 

上 下 文 管理 (context manager) 语句 with 可 以 自动 管理 资源 ,不 论 因 为 什么 原因 (哪怕 
是 代码 引发 了 异常 ) 跳 出 with 块 ,总 能 保证 文件 被 正确 关闭 ,并且 可 以 在 代码 块 执行 完毕 
后 自动 还 原 进入 该 代码 块 时 的 现场 ,常用 于 文件 操作 ,数据库 连接 、 网 络 通信 连接 和 多 线 
程 、 多 进程 同步 等 场合 。 具 体 用 法 请 参考 第 9 章 和 第 12 章 的 案例 。 


11.2 文档 测试 doctest 


Python 标准 库 doctest 可 以 搜索 程序 中 类 似 于 交互 式 Python 代码 的 文本 片段 ,并 运行 
这 些 交 互 式 代码 来 验证 是 否 符合 预期 结果 和 功能 ,常用 于 Python 程序 的 模块 测试 。 下 面 
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的 代码 演示 了 doctest 模块 的 用 法 ,定义 了 一 个 函数 ,预期 功能 为 可 以 对 整数 或 实数 相 加 ， 
或 连接 2 个 字符 串 .列表 元素, 或 对 两 个 集合 求 并 集 ,并 返回 结果 。 
示例 11-1 使 用 doctest 模块 测试 Python 代码 。 


Gef acd (valuel ,value?) : 
征 面 一 对 三 引号 之 间 是 测试 代码 ,doctest 会 搜索 这 些 代 码 并 执行 
群 且 根据 执行 结果 与 预期 结果 的 匹配 程度 来 测试 代码 是 否 正 确 
"Tetum the additian of tw mmibers or the concatenaticn of to string/list/bple 
>>>acd G3,5) 
8 
>>>acd(3.0,5.0) 
8.0 
>>>acd([1,2], [3,4]) 
[1,2,3,4] 
>>>acd((1,), CQ,3,4)) 
(1,2,3,4) 
>>>ecad, [3]) 
Tracesback (most Tecent call last): 


TypesError: valusl and value? mst be of the same type 
>>>acd 0,'2') 
Traceback (rost reoent cell last): 


TypeError: valusl and value? mst be of the same type 
>>>acd([1], 2,)) 
Traceback (rost Tecent call last): 


TypeRError: valusl and value? mst be of the same type 
>>>acd ("1234', [1,2,3,4]) 
Traceback (rost Tecent call last): 


TYPsError: valuel and value? must be of the seame type 
>>>acd({1,2,3}, {3,4,5}) 

{1,2,3,4,5} 

>>>acd({1:1}, {2:2)) 

Traceback (rost Tecent call last): 


TypeRrror: valuel and value? mst be the type of int, float, str, list, bple or set 
秆 面 是 正式 的 功能 代码 
if type Waluel) nct in (inmt, float, str, list, tuple, set) : 
raise Typegrror (‘valuel and value? must be the type of int, float, str, list,tiple or set') 
if type valuel) ! type (value2): 
raise TYpsError (‘valuel and value? must be of the sare type') 
证 type (valuel) ==set: 
Tetbum valuel | value? 
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Gobctest.testmpa() 
Print (acd (3,5)) 
把 上 面 的 代码 保存 成 Python 程序 文件 doctest_demo. py ,在 IDE 中 直接 运行 ,如 果 函 
数 功能 完全 符合 预期 的 功能 要 求 就 会 输出 正确 的 结果 ,如 果 有 不 符合 预期 结果 的 代码 就 
会 给 出 相应 的 提示 。 在 命令 提示 符 环 境 中 使 用 带 -v 参数 的 方式 执行 ,可 以 看 到 详细 的 测 
试 过 程 ,如 图 11-1 所 示 。 





C:NPython35 和 ython test.py -v 


ying: 
add(3，5) 
Expecting: 
日 











亚 ] 

Trying: 
add(3. 

Expecti 


二 
此 


Pyine: 

YY aga 2], [3, 4]) 
Expecting: 

[1, 3, 4 














5 a,), (2, 3, OD)) 
ti 2 

3, 4 

ok 





Trying: 
add(1, [3]) 
Expecting: 
Traceback (most recent call last): 


TypeError: valuel and value2 mst be of the same type 
E33 
ine: 

add(1, 
Expecting: 

Traceback (mst recent call 1ast): 





) 


TypeError: valuel and value2 mist be of the same type 
可 


Tying: 
add([1], (2,)) 
Expecting: 
Traceback (most recent call last): 


__ Typelrror: valuel and valus2 mst be of the sam type 


most recent call 1ast): 


: valuel and value2 must be of the same type 








图 11-1 doctest 测试 过 程 示意 图 
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11.3 单元 测试 unittest 


软件 测试 对 于 保证 软件 质量 非常 重要 ,尤其 是 升级 过 程 中 不 应 影响 系统 原来 的 用 法 ， 
是 未 来 重 构 代码 的 信心 保证 。 一 般 来 说 稍微 有 些 规模 的 软件 公司 都 有 专门 的 测试 团队 来 
保证 软件 质量 ,但 作为 程序 员 , 首 先 应 该 保证 自己 编写 的 代码 准确 无 误 地 实现 了 预定 
功能 。 

软件 测试 方法 有 很 多 ,从 软件 工程 角度 来 讲 ,可 以 分 为 白 盒 测 试 和 黑 盒 测试 两 大 类 。 
其 中 ,和 白 盒 测试 主要 通过 阅读 程序 源 代码 来 判断 是 否 符合 功能 要 求 ,对 于 复杂 的 业务 逻辑 
白 盒 测试 难度 非常 大 ,一般 以 黑 盒 测试 为 主 , 白 盒 测试 为 辅 。 黑 盒 测试 不 关心 模块 的 内 部 
实现 方式 ,只 关心 其 功能 是 否 正确 ,通过 精心 设计 一 些 测 试用 例 来 检验 模块 的 输入 和 输出 
是 否 正确 ,最 终 判 断 是 否 符合 预定 的 功能 要 求 。 

单元 测试 是 保证 模块 质量 的 重要 手段 之 一 ,通过 单元 测试 来 管理 设计 好 的 测试 用 例 ， 
不 仅 可 以 避免 测试 过 程 中 人 工 反复 输入 可 能 引入 的 错误 ,还 可 以 重复 利用 设计 好 的 测试 
用 例 ,具有 很 好 的 可 扩展 性 ,大 幅度 缩短 代码 的 测试 时 间 。Python 标准 库 unittest 提供 了 
大 量 用 于 单元 测试 的 类 和 方法 ,其 中 最 常用 的 是 TestCase 类 ,其 常用 方法 如 表 11-1 所 示 。 


表 11-1 TestCase 类 的 常用 方法 




















方法 名 称 功能 说 明 方法 名 称 功能 说 明 
assertEqual( a,b) a== assertNotEqual( a,b) al=b 
assertTrue( x) bool( x) is True assertFalse( x) bool( x) is False 
assertls( a,b) aisb assertIsNot(a,b) ais notb 
assertIsNone(x) x is None assertIsNotNone( x) x is not None 
assertIn( a, b) ainb assertNotIn( a,b) anotinb 





assertlsInstance( a,b) 


isinstance(a,b) 


assertNotlsInstance( a,b) 


not isinstance( a,b) 





























assertAlmostEqual( a,b) round(a—b,7)= =0 assertNotAlmostEqual( a,b) round(a—b,7) !=0 
assertGreater( a,b) a>b assertGreaterEqual( a,b) a> =b 
assertLess( a,b) a<b assertLessEqual( a,b) a<=b 
assertRegex( s,r) r. search( s) assertNotRegex( s,r) not r. search( s) 

每 项 测试 开始 之 前 自动 调 每 项 测试 完成 之 后 自动 调 
spt) 用 该 丁 数 人 用 该 函数 


其 中 ,setUp( ) 和 tearDown( ) 这 两 个 方法 比较 特殊 ,分别 在 每 个 测试 之 前 和 之 后 自动 
调用 ,常用 来 执行 数据 库 连 接 的 创建 与 关闭 .文件 的 打开 与 关闭 等 操作 ,避免 编写 过 多 的 


重复 代码 。 


示例 11-2 编写 单元 测试 程序 。 
以 第 6 章 自 定 义 栈 的 代码 为 例 ,演示 如 何 利用 unittest 库 对 Stack 类 中 入 栈 、 出 栈 、 改 
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变 大 小 以 及 满 / 空 测试 等 方法 进行 测试 ,并 将 测试 结果 写 人 文件 test_Stack_result. txt。 


fram mystack import Stack 
Pythan 单元 测试 标准 库 
jimport unittest 


class Teststack(unittbest.Testcase) : 
def setDp (self) : 
调试 之 前 以 追加 模式 打开 指定 文件 
self. 印 -pen("D:\Nbest_ Stack result.txt', ‘a+') 


GEf tearpom (self) : 
出 试 结束 后 关闭 文件 
salf.fp.close() 


Gef test_ ismmpty (self) : 
try: 


S=Stack() 

崩 保 函数 返回 结果 为 True 
Self.assertTrue (s.iserpty ()) 
self.fp.write ('ismpty passed\n') 


ExcepE Excepticn as e: 


self. 印 .write('isEhnpty failed\n') 


GEf test_ clear (self) : 
try: 


5 =Stack (5) 

for i in ['a','b','c']: 
5s.push(i) 

柚 试 清空 栈 操 作 是 否 工 作 正 常 

5s.clear() 

Self.assertTrue (s.isEnpty ()) 

self.fp.write('clear passed\n') 


Eept ExcepEicn as e: 


salf.fp.write('clear failed\n') 


Gef test ispull (sealf): 


try: 


s=stack 3) 
SPush tl) 

s-Pushe) 

s-PushG) 
self.assertTrue(s.ispul1 ()) 
self.fp.write('ispull passed\n') 
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except Eoeption as e: 
self. 印 -write ('isFull failed\n') 


GEf test Pushpop (self) : 
try: 

5s=Stack() 
s-push G) 
生 保 入 栈 后 立刻 出 栈 得 到 原来 的 元 素 
self.assertEonal (s.pop() ,3) 
5.push('a') 
Self.assertEcpal (s.pp0,'a') 
self. 印 .write (push and pop passed\n') 


self.assertTrue(s.isFull ()) 

柚 试 扩大 栈 空间 是 否 正常 工作 

S.SsetSize (9) 

5.push(8) 

self.assertTrue(s.isFull1 ()) 

self.assertEgnal (5.pop() ,8) 

柚 试 缩小 栈 空间 是 否 正 常 工 作 

5.setSize (4) 

Self.asserthqal (s. size,9) 

salf.fp.write('setsize passed\n') 
Eept Excepticn as e: 

self.fp.write('setsize failed\n') 


1 ne = min _" 
wnittest .main() 
在 Eclipse + PyDev 环境 中 ,Python 程序 有 Python Run 和 Python unittest 两 种 运行 方 
式 , 前 者 只 运行 “if __name__ = = main__':" 这 一 行 所 限定 的 代码 块 ,而 后 者 会 执行 所 


有 的 测试 代码 ,也 就 是 继承 自 unittest. TestCase 的 类 中 所 有 以 test 开头 的 方法 。 

在 进行 单元 测试 时 应 注意 : 加 测试 用 例 的 设计 应 该 是 完备 的 ,应 保证 覆盖 尽 可 能 多 
的 情况 ,尤其 是 要 覆盖 边界 条 件 ,对 目标 模块 的 功能 进行 充分 测试 ,避免 漏 测 ; @ 测 试用 
例 以 及 测试 代码 本 身 也 可 能 会 存在 bug, 通 过 测试 并 不 代表 目标 代码 没有 错误 ,但 是 一 般 
而 言 ,不 能 通过 测试 的 模块 代码 是 存在 问题 的 ; 图 再 好 的 测试 方法 和 测试 用 例 也 无 法 保 
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证 能 够 发 现 所 有 错误 ,必须 通过 不 停 改 进 和 综合 多 种 测试 方法 并 且 精 心 设计 测试 用 例 来 
发 现 尽 可 能 多 的 潜在 问题 ; @ 除 了 功能 测试 ,还 应 对 程序 进行 性 能 测试 与 安全 性 测试 ,其 
至 还 需要 进行 规范 性 测试 以 保证 代码 可 读 性 和 可 维护 性 。 


11.4 覆盖 测试 


覆盖 测试 通过 代码 分 析 工 具 和 跟踪 钩子 来 判断 哪些 代码 可 执行 以 及 哪些 代码 被 执行 
了 ,是 对 单元 测试 的 有 效 补充 ,可 以 用 来 判断 测试 的 有 效 性 。 

Python 扩展 库 coverage 可 以 实现 对 Python 代码 的 覆盖 测试 ,使 用 pip 工具 安装 之 后 ， 
可 以 使 用 命令 coverage run file. py 对 Python 程序 file. py 进行 覆盖 测试 ,然后 使 用 命令 
coverage report 直接 查看 测试 报告 ,或 者 使 用 命令 coverage html 生成 HTML 文件 的 测试 报 
告 , 这 些 HTML 文件 自动 保存 在 htmlcov 文件 夹 中 。 可 以 使 用 命令 coverage help 查看 
coverage 支持 的 所 有 命令 。 

例如 ,有 下 面 的 代码 用 来 判断 一 个 整数 是 否 为 素数 : 


fram ranccom inport randint 


GEf isPrime m) : 
for i in range ,intns#.5) 1): 
if nsi==0: 
retum Np' 
else: 
retim ‘Yes' 


n =randint (3,2000) 

print (n, ':', isprime (n)) 

把 上 面 的 代码 保存 为 isPrime. py ,然后 在 命令 提示 符 环境 中 首先 执行 命令 coverage 
run isPrime. py 测试 ,再 执行 命令 coverage report 查看 测试 报告 。-m 选项 用 来 显示 没有 被 
执行 到 的 代码 行 号 ,可 以 使 用 命令 coverage report -h 查看 更 多 选项 。 


C: NBython 3.5 >owerage run isPrime.py 
1862 :ND 
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另外 ,扩展 库 coverage 还 提供 了 编程 接口 支持 代码 覆盖 测试 。 例 如 ,把 上 面 的 素数 判 
断 程序 修改 为 下 面 的 代码 并 执行 ,会 自动 生成 测试 报告 。 

import oerage 

fram random import randint 


Cov =oNWerage .Coverage () 
cov.start () 


Cef isPrime n): 
for i in range Cintmn*#a.5) 2): 
if nsi==0: 
Tetmm Np' 


11.5 软件 性 能 测试 


在 本 书 前 面 章节 中 多 次 演示 过 使 用 Python 标准 库 time 和 timeit 提供 的 函数 来 测试 代 
码 运 行 时 间 。 除 了 前 面 介绍 的 用 法 ,还 可 以 使 用 下 面 的 方法 来 测试 代码 运行 时 间 : 


class Timer (Goject) : 
Gef __enter _ (self): 
self.start =tire() 

retim self 


of__ edit _ (salf, sargs): 
salf.end time() 
self.seccncs =self.end -self.start 


GEf isPrime m) : 
ifn==32: 
Tetom True 
for i in range C,int Mm #0.5) +2): 
if nsi==0: 
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retium False 
retum True 


with Timer() as t: 
for i in range (1000): 
isPrime (99999999999999999999999) 
print (t.seoonds) 


运行 上 面 的 程序 ,会 输出 isPrime( ) 函数 运行 1000 次 所 需要 的 时 间 。 另 外 ,在 很 多 时 


候 ,除了 要 测试 代码 运行 所 需要 的 时 间 ,还 需要 检测 代码 运行 过 程 中 的 内 存 占 用 情况 ,这 
时 候 需 要 使 用 pip 安装 Python 扩展 库 memory_profiler, 然 后 编写 下 面 的 代码 : 


frammemory_ profiler inport profile 


@ prorile 政 饰 器 
Cef isPrime m) : 
if n==2: 
retim True 
for i in range C,int In*0.5) +2): 
if nsi==0: 


3 33.9 MiB 0.0 MiB @profile 

a Cef isPrime (n): 

入 33.9 MiB 0.0 MiB ifn==2: 

6 retum True 

肝 33.9 MiB 0.0 MiB for i in range@,int mn* *# 0.5) 42): 
8 33.9 MiB 0.0 MiB if nsi==0: 

和 33.9 MiB 0.0 MiB Tetbmm False 

10 rebm True 


利用 Python 标准 库 cProfile 也 可 以 对 Python 程序 进行 测试 ,并 给 出 统计 信息 ,包括 代 


码 的 执行 次 数 、 运 行 时 间 等 ,为 代码 测试 和 性 能 优化 提供 有 力 依 据 。 


>>>aef fac mn) : 
assert jsinstance (n, int) and n> 
ifnin ©0,D): 
rebm1 
time.slesp(0.1) 
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rebmn* facm) 


>>>import time 
>>>cProfile.rn('fac 
92 finction 


G0)') 
calls (63 primitive calls) in 2.899 seomos 


Ordered by: standard name 


nals tcttime Percall cumtime Percall 五 Jeneme:linenp (function) 


30 人 0.001 
入 0.000 

1 0.000 

30 0.000 
29 2.899 

1 0.000 


0.000 2.899 2.899 ”yshel14 >:1 (fac) 

0.000 2.899 2.899 ”<string >:1 (<mane >) 

0.000 2.899 2.899 {built -in method builtins.exec} 

0.000 0.000 0.000 {Puilt -in method puiltins 
.jsinstance} 

0.100 2.899 0.100 {built -in method time.sleep} 

0.000 0.000 0.000 {method 'disable' of ' lsprof 


.Profiler' cojects} 


上 面 的 测试 结果 中 各 部 分 含义 如 表 11-2 所 示 。 


表 11-2 cProfile 测试 结果 各 部 分 含义 

















名 称 含义 
ncalls 调用 次 数 
tottime 该 函数 执行 所 用 的 总 时 间 ,不 包括 调用 子 函 数 所 用 的 时 间 
percall 该 函数 单 次 执行 所 用 的 时 间 
cumtime 该 函数 及 其 所 有 子 函数 执行 所 用 总 时 间 
percall 该 函数 及 其 所 有 子 函数 单 次 执行 所 用 时 间 





filename :lineno( function) 





函数 或 代码 有 关 信 息 


11.6 代码 调试 


1161 使 用 IDLE 调 试 


当 程序 运行 发 生 错 误 或 者 得 到 了 非 预期 的 结果 时 ,是否 能 够 熟练 地 对 程序 进行 调试 
并 快速 定位 和 解决 问题 是 体现 程序 员 综 合 能 力 的 重要 标准 之 一 。 

使 用 IDLE 的 调试 功能 时 ,首先 单 击 IDLE 的 菜单 Debug 一 Debugger 打开 调试 器 窗口 ， 
然后 打开 并 运行 要 调试 的 程序 ,最 后 切换 到 调试 器 窗口 使 用 其 中 的 控制 按钮 进行 调试 。 
图 11-2 为 IDLE 调试 窗口 及 其 功能 简要 介绍 ,可 以 使 用 调试 按钮 对 程序 进行 单 步 执 行 , 实 
时 查看 变量 的 当前 值 并 跟踪 其 变化 过 程 ,对 于 理解 程序 内 部 工作 原理 和 发 现 程序 中 存在 


的 问题 非常 有 帮助 。 
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显示 所 有 局 部 变量 
调试 按钮 显示 当前 执行 的 代码 


Debug Control 





显示 所 有 全 部 变量 





件 


四 本 
以 及 正在 执行 indLongestReuse. py:13: 人 odule>D 
的 行 号 





bab” runO, line 307, exec cmd in Elobsls, locels 
nain module> Oline 3 fron os Dath import 15 


当前 执行 行内 容 








局 部 变量 
Globals 
builtins module '_ builtin (built-in)> 


全 局 变量 





图 11-2 IDLE 调试 器 窗口 


示例 11-3 ”使 用 IDLE 调试 Python 程序 。 

假设 有 Python 程序 demo. py ,其 功能 为 生成 1000 个 随机 字符 (英语 字母 大 小 写 或 数 
字 ) ,然后 查看 某 个 字符 的 出 现 次 数 , 代 码 如 下 : 

jimport string 

fram Irancom jmport choice 

characters =string.ascii letters +string.digits 

selected=[choice (Gharacters) for i in range (1000)] 

ch =hoice (selected) 

Print (ch ': selected.ccount (Gh) ) 

然后 使 用 IDLE 对 该 程序 进行 单 步调 试 (使 用 Step 按钮 ) ,调试 过 程 中 的 部 分 截图 如 
图 11-3 和 图 114 所 示 。 可 以 发 现 , 在 调试 过 程 中 执行 了 很 多 不 属于 demo. py 程序 的 代 
人 码 , 这 是 正常 的 ,因为 调用 标准 库 函 数 时 会 自动 进入 标准 库 并 执行 其 中 的 代码 。 如 果 不 想 
进入 和 执行 标准 库 代码 ,可 以 使 用 Over 按钮 。 


1162 使 用 Edipse + BMDa 进行 代码 调试 


Eclipse + PyDev 提供 了 更 加 强大 的 代码 调试 功能 ,使 用 也 更 加 方便 和 灵活 。 在 代码 
窗口 中 某 行 左 侧 的 标尺 上 右 击 ,在 弹出 的 菜单 中 使 用 Add BreakPoint 在 该 行 设置 断 点 , 然 
后 使 用 菜单 Run 一 Debug As 一 Python Run ,在 弹出 的 窗口 中 选择 Yes 进入 调试 器 界面 ,最 
后 使 用 菜单 或 快捷 键 F5( Step Into) .F6( Step Over) .F7( Step Return ) 或 F8( Resume ) 进行 
调试 ,并 在 相应 的 窗口 中 查看 程序 状态 和 变量 的 当前 值 。 调 试 界面 如 图 11-5 所 示 。 
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<module ‘builins’ (built-in)> 

None 

‘Ci/Python 3.5/demo.py 
rozen_importlib.BuiltinImporter > 


“abcdefghijkimnopqrstuvwxyz.JKLMNOPQRSTUVWXYZ0123456789" 
<bound method Random.choice.ject at Ox0000000002E66F68> > 





图 11-3 ”程序 调试 截图 (一 ) 


WS Stack FF Source 
Go | step | Over | ou | 
FF Locals Globals 


random.py:231: randbelow0 





fbdb'.run0, line 431: exectcmd, globals, locals) El 








Locals 
BuilinMethod <class ‘builtin_function_or_method'> 
<class "method'> 
<built-in method getrandbit..bject at 0x0000000002E66F68> 
<class int> 
6 
9007199254740992 
62 
35 
<built-in method random of .bject at Ox0000000002E66F68> 
<random.Random object at Ox0000000002E66F68> 
<dlass type'> 








图 114 程序 调试 截图 (二 
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| 四 | ave ee> 到 昌国 













































次 Debug 员 入 | 二 | 多 一口 0 Veriebles 3) oo Breakpoints =- 吕 
4 e Stack test.py [Python Run] [= 和 构 半 日 了 
“本 testpy Name Ve 
2 oP MainThread - pid_7872 id_17966976 > © Globals a 
三 bubblesort ftest.py:13] 各 int 
三 bubbleSort ftest.py:29] Poe 
三 =module> testpy35 pe 
-| » 
mew 全 届 =- o /a 0 
12 flag = False | pr < ud 
13 | 
lae 人 个 元 玉江 人 要好 和 | | [wpe frer text 
15 认 天 序章 序 5— < 一 randint (random) 
16 exp = ‘Lat[j] > Lst[j+1]" 
17 要 rever5e-True 划 寿 地 关 玫 @@ bubblesort 
18 if reverse: © lst 
19 exp = ‘Lst[j] < Lst[j+1]" 
28 if eval(exp): 
21 1st[j], 1st[j+1] = 1st[j+1], 1st[j] 
22 Je 
23 草本 没有 六 生 元 家 们 并、 则 表示 已 和 各 
“本 让 
Console 33 
testPy 
pydev debugger: starting (pid: 7872) ~ 
ore sort: 
[7, 66, 73, 8, 1, 48, 12, 99, 44, 19, 54, 6, 42, 95, 88, 39, 84, 46, 13, 76] - 
= 











日 9 





图 11-5 ”Eclipse + PyDev 调试 界面 


1163 使 用 pdb 调试 


pdb 是 Python 自 带 的 交互 式 源 代码 调试 模块 ,其 源 文件 为 pdb. py, 感 兴趣 的 读者 可 
以 在 Python 安装 目录 下 找到 该 文件 进行 阅读 并 理解 其 工作 原理 。pdb 模块 提供 了 代码 调 
试 所 需要 的 绝 大 部 分 功能 ,包括 设置 /清除 (条 件 ) 断 点 .启用 /禁用 断 点 . 单 步 执 行 、 查 看 
栈 帧 、 查 看 变量 值 .查看 当前 执行 位 置 、. 列 出 源 代 码 、 执 行 任意 Python 代码 或 表达 式 等 。 
pdb 还 支持 事后 调试 ,可 在 程序 控制 下 被 调用 ,并 且 可 以 通过 pdb 和 cmd 接口 对 该 调试 器 
进行 扩展 。pdb 模块 常用 调试 命令 如 表 11-3 所 示 。 

使 用 pdb 模块 调试 Python 代码 的 形式 常见 的 有 3 种 : 在 交互 模式 下 调试 特定 的 代码 
块 ,在 程序 中 显 式 插入 断 点 ,把 pdb 作为 模块 来 调试 程序 。 

(1) 在 交互 模式 下 使 用 pdb 模块 提供 的 功能 可 以 直接 调试 语句 块 . 表 达 式 、 函 数 等 多 
种 脚本 ,常用 的 调试 方法 如 下 。 
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表 11-3 常用 pdb 调试 命令 

















简写 /完整 命令 用 法 示例 解释 
ares) 显示 当前 函数 中 的 参数 
b 173 在 173 行 设置 断 点 
全 人 人 ) | b fanction 在 function 函数 第 一 条 可 执行 语句 位 置 设置 断 点 
funetion [| 不 带 参数 则 列 出 所 有 断 点 ,包括 每 个 断 点 的 触发 次 数 .当前 


condition ] ] 


忽略 计数 以 及 与 之 关联 的 条 件 





b 175 ，condition 


设置 条 件 断 点 , 仅 当 condition 的 值 为 True 时 该 断 点 有 效 




































































1 cl 清除 所 有 断 点 
cl (ear) [ filename: 
lineno | bpnumber | cl file:line 删除 指定 文件 中 指定 行 的 所 有 断 点 

ee cl359 删除 第 3.5 .9 个 断 点 
condition 。 bpnumber | condition 3 a<b | 仅 当 a<b 时 3 号 断 点 有 效 

condition] condition 3 将 3 号 断 点 设置 为 无 条 件 断 点 
continue 继续 运行 至 下 一 个 断 点 或 脚本 结束 
disable = [ bpnumber | ， Ee es 

pnyen srr disable 3 5 禁用 第 3 .5 个 断 点 ,禁用 后 断 点 仍 存在 ,可 以 再 次 被 启用 

pnu 

d(own) 在 栈 跟踪 器 中 向 下 移动 一 个 栈 帧 
enable [bpnumber 二 本 二 

村 enable n 启用 第 n 个 断 点 
h(elp) [command] 查看 pdb 帮助 
dts pmbier 为 断 点 设置 忽略 计数 ,count 默认 值 为 0。 若 某 断 点 的 忽略 
计数 不 为 0, 则 每 次 触发 时 自动 减 1, 当 忽略 计数 为 0 时 该 

断 点 处 于 活动 状态 
j(ump) j20 跳 至 第 20 行 继续 运行 
1 列 出 脚本 清单 ,默认 11 行 
1(Cist) [first [, last]] |lm,n 列 出 从 第 m 行 到 第 n 行 之 间 的 脚本 代码 
lm 列 出 从 第 m 行 开始 的 11 行 代码 
n(ext) 执行 下 一 条 语句 , 遇 到 函数 时 不 进入 其 内 部 
pl(rint) pi 打印 变量 i 的 值 
q(uit) 退出 pdb 调试 环境 
r( eturn) 一 直 运 行 至 当前 函数 返回 
i 设置 临时 断 点 ,该 类 型 断 点 只 被 中 断 一 次 ,触发 后 该 断 点 自 
动 删除 

step 执行 下 一 条 语句 , 遇 到 函数 时 进入 其 内 部 





uCp) 








在 栈 跟踪 器 中 向 上 移动 一 个 栈 帧 
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续 表 
简写 /完整 命令 用 法 示例 解 释 
w( here) 查看 当前 栈 帧 
在 pdb 中 执行 语句 ,! 与 要 执行 的 语句 之 间 不 需要 空格 , 任 
[ 1] statement 何 非 pdb 命令 都 被 解释 为 Python 语句 并 执行 ,甚至 可 以 调 
用 函数 或 修改 当前 上 下 文中 变量 的 值 
直接 回 车 则 默认 执行 上 一 个 命令 








@ pdb. run ( statement [ ，globals[ ，locals] ] ) : 调试 指定 语句 ,可 选 参 数 globals 和 
locals 用 来 指定 代码 执行 的 环境 ,默认 是 _main_ 模块 的 字典 。 

@) pdb. runeval( expression[ ,globals[ , locals] ] ) : 返回 表达 式 的 值 ,可 选 参数 globals 
和 locals 的 含义 与 上 面 的 run( ) 函数 一 样 。 

@ pdb. runcall( function[ ，argument,…] ) : 调试 指定 函数 。 

@ pdb. post_mortem( [traceback] ) : 进入 指定 traceback 对 象 的 事后 调试 模式 ,如果 没 
有 指定 traceback 对 象 , 则 使 用 当前 正在 处 理 的 一 个 异常 。 

例如 ,下 面 的 代码 演示 了 如 何 调试 一 个 函数 ,其 中 “(Pdb)" 为 提示 符 , 在 后 面 输入 并 
执行 前 面 表 11-3 中 介绍 的 命令 即 可 。 


>>>inport Pdb 
>>>Gef cemp() : 
fram Iranccom jimport randint 
X=[randint (1,10) for i in range (20)] 抢 机 生成 20 个 介 于 1~10 的 整数 
m=mex (x) 九 大 数 
工 =[incex for incdex, value in enumerate (x) if value ==m] 
Print (r) 答 出 最 大 数 所 在 的 下 标 


>>>Edb.runcall (damp) 秽 试 函数 
><Pyshell#3 > 人 2)Gerp () 

(Eb) n 执行 下 一 条 语句 
><Fyshell#3 > G)Gerp () 

(Fb) n 

><Pyshell#3 >(4)Gemp (0) 

(Eb) px 圭 看 变量 值 
[9,5,8,9,7,8,10,3,8,5,2,8,8,4,9,10,8,7,5,1] 

(Pb) pm 

水 六 六 NameRError: name "mm' is not defined 

(Eh) n 

><Eyshell43>(G)adam(0 

(EP) pm 

10 

(Rb) 工 短 行 函数 直至 结束 
[6,15] 

-ebm-—— 
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a 


> <pyshell43 >(6) da () - Ame 


(CEab) 1 
[mcs] 
(Eb) pr 
[6,15] 
(EP) pm 
10 


(ab) q 很 出 调试 模式 


(2) 在 程序 中 嵌入 断 点 来 实现 调试 功能 。 
在 程序 中 首先 导入 pdb 模块 ,然后 使 用 pdb. set_trace( ) 在 需要 的 位 置 设置 断 点 。 如 


果 程 序 中 存在 这 样 插入 的 断 点 ,那么 在 命令 提示 符 环境 下 执行 该 程序 或 双击 执行 程序 时 
将 自动 进行 pdb 调试 模式 ,即使 该 程序 当前 不 处 于 调试 状态 。 例 如 ,下 面 的 程序 


IsPrime. py : 


inrport Pob 


n=37 
pdb.set_ trace() 
for i in range (2,n): 
if nsi==0: 
Print (Np') 
break 
else: 
Print ('Yes') 


由 于 使 用 pdb 设置 了 断 点 ,在 IDLE 中 运行 该 程序 时 会 自动 打开 调试 模式 ,如 图 11-6 


所 示 。 在 命令 提示 符 环境 中 运行 该 程序 时 也 会 自动 进入 pdb 调试 模式 ,如 图 11-7 所 示 。 














> espyt i i 
[a in camee(2 可 : 

> ci Python isprine- py (6) Caodule> () 
[Ba i 


(Pdb) 
Ee python3S\isprine. py (5) <aodule> () 
[> for i in range(2, m): 
[ay oi 






=\Python35>python 1sPrine-py 

> c:>python35\isprime -pyC5><module><C> 
> for i in rangeK2-n2: 

pay, Pdb> p 诗 

> ce: enasyieprame- py (6) Caodule> () NaneError: nane ’i’ is not defined 
[Ba = se 


(Pab) 
> ce: rthomo\isprine: 7 (5) eosne> 0 


[> for i in range(2, > if nx == O: 


(Pdb) n Papb: 
< Pana6Yisprime- py (6) module> 0 
>it wi = 
[eb) pi Pdb> 1 
import pdb 
[ea a 
Cae) 1 i 关 
和 pdb.set_tracec> 
3 n= 37 for i in rangeC2.n): 
4 pdb.set_trace() -> nx -= Gs 
8 本 printC’No’> 
? break 
上 else: 
全 printC’Yes’> 




















图 11-6 运行 程序 自动 进行 pdb 调试 模式 图 11-7 在 命令 提示 符 环境 运行 程序 
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(3) 使 用 命令 行 调试 程序 。 

在 命令 行 提示 符 下 执行 “python -m pdb 脚本 文件 名 ”, 可 以 直接 进入 调试 环境 ,即使 
程序 中 并 没有 设置 任何 断 点 ,也 没有 使 用 pdb 的 任何 功能 ; 当 调试 结束 或 程序 正常 结束 以 
重启 该 程序 。 例 如 ,把 上 面 的 程序 IsPrime. py 中 pdb 模块 的 导入 和 断 点 插入 函 
数 都 删除 ,然后 在 命令 提示 符 环境 中 使 用 调试 模式 运行 ,如 图 11-8 所 示 。 


5SEyERon35yPYEROR -nm pab TsPrine-py 
c:\python35\isprine .pyC1)<nodule>C> 











Pab> n 
c: \python35\isprine .pyC2>Cnodule>C> 
> for 1 in range<2-n?: 

Pab》 
c:\python35\ib\bdb.pyC431>runC> 

> exec<cmd- globals. locals> 
<string>C1?<module><> 

c: \python35\isprine .pyC2>Cnodule>C> 
> for 1 in rangeC2.n): 

Pab> n 

c:\python35\isprine .pyC3>Cnodule>C> 





图 11-8 ”以 调试 模式 运行 程序 
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12.1 多 线程 编程 


多 线程 技术 的 引入 并 不 仅仅 是 为 了 提高 处 理 速度 和 硬件 资源 的 利用 率 ,更 重要 的 是 
可 以 提高 系统 的 可 扩展 性 (采用 多 线程 技术 编写 的 代码 移植 到 多 处 理 器 平台 上 不 需要 改 
写 就 能 立刻 适应 新 的 平台 ) 和 用 户 体验 。 虽 然 对 于 单 核 CPU 计算 机 而 言 ,使 用 多 线程 并 
不 能 提高 任务 完成 速度 ,但 有 些 场合 必须 要 使 用 多 线程 技术 ,或 者 采用 多 线程 技术 可 以 让 
整个 系统 的 设计 更 加 入 性 化 。 例 如 ,在 执行 一 段 代码 的 同时 还 可 以 接收 和 响应 用 户 的 键 
盘 或 鼠标 事件 以 提高 用 户 体验 ; Windows 操作 系统 的 Windows Indexing Services 创建 了 一 
个 低 优先 级 的 线程 ,该 线程 定期 被 唤醒 并 对 磁盘 上 的 特定 区 域 的 文件 内 容 进 行 索引 以 提 
高 用 户 搜索 速度 ;打开 Photoshop .3ds Max 这 样 的 大 型 软件 时 需要 加 载 很 多 模块 和 动态 链 
接 库 ,软件 启动 时 间 会 比较 长 ,可 以 使 用 一 个 线程 来 显示 一 个 小 动画 来 表示 当前 软件 正在 
启动 , 当 后 台 线 程 加 载 完 所 有 的 模块 和 库 之 后 ,结束 该 动画 的 播放 并 打开 软件 主 界面 ; 字 
处 理 软件 可 以 使 用 一 个 优先 级 高 的 线程 来 接收 用 户 键盘 输入 ,而 使 用 一 些 低 优 先 级 线程 
来 进行 拼写 检查 .语法 检查 ,分 页 以 及 字数 统计 之 类 的 功能 并 将 结果 显示 在 状态 栏 上 ,对 
于 提高 用 户 体验 有 重要 帮助 。 图 12-1 展示 了 字 处 理 软件 WPS 启动 之 后 创建 的 部 分 线 
程 ,图 12-2 中 列 出 了 作者 的 计算 机 上 某 个 时 刻 各 进程 拥有 的 线程 数量 。 可 见 在 系统 运行 
过 程 中 会 同时 存在 大 量 的 线程 ,这 些 线程 的 调用 和 同步 必然 需要 有 一 定 的 算法 和 相应 的 
机 制 ,这 也 正 是 本 节 的 内 容 。 


1211 线程 概念 与 标准 库 theading 


磁盘 上 的 应 用 程序 文件 被 打开 并 执行 时 创建 一 个 进程 ,但 进程 本 身 并 不 是 可 执行 单 
元 ,从 来 不 执行 任何 东西 ,主要 用 作 线 程 和 相关 资源 的 容器 。 要 使 进程 中 的 代码 真正 运行 
起 来 ,必须 拥有 至 少 一 个 能 够 在 这 个 环境 中 运行 代码 的 执行 单元 ,也 就 是 线程 。 线 程 是 操 
作 系 统 调度 的 基本 单位 ,负责 执行 包含 在 进程 地 址 空间 中 的 代码 并 访问 其 中 的 资源 。 当 
一 个 进程 被 创建 时 ,操作 系统 会 自动 为 之 建立 一 个 线程 ,通常 称 为 主线 程 。 一 个 进程 可 以 
包含 多 个 线程 , 主线 程 根据 需要 再 动态 创建 其 他 子 线程 ,操作 系统 为 每 个 线程 保存 单独 的 
寄存 器 环境 和 单独 的 堆栈 ,但 是 它们 共享 进程 的 地 址 空间 .对象 句柄 .代码 数据 和 其 他 资 
源 。 线 程 总 是 在 某 个 进程 的 上 下 文中 被 创建 .运行 和 结束 ,不 可 以 脱离 进程 而 独立 存在 ， 
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但 允许 属于 同一 个 进程 中 的 多 个 线程 之 间 进 行 数据 共享 和 同步 控制 。 一 般 来 说 , 除 主线 
程 的 生命 周期 与 所 属 进程 的 生命 周期 一 样 之 外 ,其 他 线程 的 生命 周期 都 小 于 其 所 属 进程 
的 生命 周期 。 





















































CPu 。 内存 (.， 线程 于 

二 Microsoft spy++ -线程 1 00 13,900 Kk 566 

00 L255k 23 

00 29,196 Ek 加 

00 les0xk 10 

om Sozx 13 

00 23s2k 12 

= Ol 24,908K 5 

[一 @@ 线程 00000614 SGCALENDAR x 3 

四 -人 @ 线程 000012BC WPS 00 ST04k 15 

名 线程 0000189C WPS 00 8020 29 

一 和 @ 线程 00001660 WP5 08 109,428 KK 64 

一 @ 线程 00001BC8 WPS 00 000k 13 

| 令 线程 000018F0 WPS oo 2,872 K 3 

一 @ 闭 程 00001808 WPS oo Sieox 2 

|-@ 二 各 000016M4 WPS QQPCRealTisespe dfe 00 2414kK 2 

[全 线程 00000E24 WPS QQPCTray sxe #32 dfe Ol S59,144K 153 

旬 - 售 线程 0000194C WPS SGCalendar exe +32 dfe 00 T1400k 12 

仿 线程 000018E0 WPS SoftlerLite exe .. dfe oo 3,204 K 8 

此 要 和 a Sogoucloud exe *32 dfe oo Ts44 kK 21 

Spyxx_ mdB4 exe dfe 00 werx 3 

上- 名 线程 00001198 WPS taskene exe afe 00 Lox 并 

申 -全 线程 000018AC WPS taskhost. exe afg oo 2,308 Kk 10 

申 - 人 @ 线程 00001024 WPS tasingr. exe ae ol 2,900 kK 日 

人 线程 0000127C WPS TXPlatform_ exe 32 dfe 00 04 Kk 4 

一 仿 线程 00001648 WPS WhCer axe dfe oo 3,460 K 3 

申 -@ 线程 00001804 WPS iacen 00 zs0e 工 3 

申 -@@ 线程 00001488 WPS wps exe dfe 00 145,156 kK 26 

全 线程 00001420 WPS wpscenter exe #32 dfe 00 6,272K 32 

多 晓 程 0000143C WPS wpscloudswr. exe... dfe 00 35,200k 2B 

[二 全 和 全 下 于 Toulaleai acante .. dfe oo 4,532 K 20 
图 12-1 WPS 创建 的 部 分 线程 图 12-2 系统 中 每 个 进程 的 线程 数量 


标准 库 threading 是 Python 支持 多 线程 编程 的 重要 模块 ,该 模块 是 在 底层 模块 
_thread 的 基础 上 开发 的 更 高 层次 的 线程 编程 接口 ,提供 了 大 量 的 方法 和 类 来 支持 多 线程 
编程 , 极 大 地 方便 了 用 户 。 标 准 库 threading 提供 的 常用 方法 如 表 12-1 所 示 。 
表 12-1 标准 库 threading 提供 的 常用 方法 
方 法 功能 说 明 

active_count( ) .activeCount( ) 返回 当前 处 于 alive 状态 的 Thread 对 象 数量 

current_thread( ) ,currentThread( ) | 返回 当前 Thread 对 象 
返回 当前 线程 的 线程 标识 符 。 线 程 标识 符 是 一 个 非 负 整数 ,这 个 























dnt) 整数 本 身 并 没 特殊 含义 ,只 是 用 来 标识 线程 ,可 能 会 被 循环 利用 
es 返回 当前 处 于 alive 状态 的 所 有 Thread 对 象 列表 
local 线程 局 部 数据 类 
main_thread( ) 返回 主线 程 对 象 , 即 启动 Python 解释 器 的 线程 对 象 

返回 创建 线程 时 使 用 的 栈 的 大 小 ,如 果 指定 size 参数 , 则 用 来 指定 
ee 后 续 创建 的 线程 使 用 的 栈 大 小 ,size 必须 是 0( 表示 使 用 系统 默认 





值 ) 或 大 于 32K 的 正 整 数 
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续 表 
方 法 功能 说 明 
ee A 南 数 传递 给 sys setprofle 
settrace( func ) 设置 之 后 每 个 线程 启动 之 前 都 会 把 funec 函数 传递 给 sys. settrace( ) 
TIMEOUT_MAX 线程 同步 获取 锁 时 的 最 大 允许 等 待 时 间 
Thread 线程 类 ,用 于 创建 和 管理 线程 
Event 事件 类 ,用 于 线程 同步 
Condition 条 件 类 ,用 于 线程 同步 
Lock .RLock 锁 类 ,用 于 线程 同步 
Semaphore .BoundedSemaphore 信号 量 类 ,用 于 线程 同步 
Timer 用 于 在 指定 时 间 之 后 调用 一 个 函数 





1212 线程 对 象 


在 一 个 函数 中 直接 调用 另外 一 个 苑 数 时 ,当前 函数 中 调用 位 置 之 后 的 代码 会 暂停 执行 ， 
直到 被 调 隐 数 执行 结束 并 正确 返回 后 才能 继续 执行 当前 函数 的 代码 。 与 直接 调用 函数 不 
同 , 以 创建 并 启动 线程 的 方式 来 执行 一 个 函数 可 以 实现 多 个 函数 中 的 代码 并 发 或 同时 运行 。 

标准 库 threading 中 的 Thread 类 用 来 创建 和 管理 线程 对 象 , 支 持 使 用 两 种 方法 来 创建 
线程 : 四 直接 使 用 Thread 类 实例 化 一 个 线程 对 象 并 传递 一 个 可 调用 对 象 作为 参数 ; @) 继 
承 Thread 类 并 在 派生 类 中 重 写 _init_() 和 run( ) 方 法 。 创 建 了 线程 对 象 以 后 ,可 以 调用 
其 start( ) 方 法 来 启动 ,该 方法 自动 调用 该 类 对 象 的 run( ) 方 法 ,此 时 该 线程 处 于 alive 状 
态 , 直 至 线程 的 run( ) 方 法 运行 结束 。Thread 对 象 的 主要 成 员 如 表 12-2 所 示 。 

表 12-2 Thread 对 象 的 主要 成 员 


成 员 说 明 
自动 调用 mn( ) 方法 ,启动 线程 ,执行 线程 代码 。 























eal) 每 个 线程 只 能 启动 一 次 

a 线程 代码 ,用 来 实现 线程 的 功能 与 业务 逻辑 ,可 以 
在 子 类 中 重 写 该 方法 来 自 定义 线程 的 行为 

init_ (self, group = None, target = None name = 

None, args = ( ) kwargs = None, verbose = None) 构造 方法 

name 读 取 或 设置 线程 的 名 字 

ident 线程 标识 , 非 0 数字 或 None( 线 程 未 被 启动 ) 

is_alive( ) ,isAlive( ) 测试 线程 是 否 处 于 alive 状态 

daemon 布尔 值 ,表示 线程 是 否 为 守护 线程 





join( timeout = None) 等 待 线程 结束 或 超时 返回 
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另外 ,threading 还 支持 使 用 Timer 类 来 创建 定时 启动 的 线程 ,调用 线程 的 start( ) 方 法 
之 后 ,线程 会 在 指定 的 时 间 ( 单 位 是 秒 ) 之 后 再 调用 线程 函数 。 


>>>aef cat : 
Erint (v) 

>>>t threading.Timer (3,danp,args =(5,)) 阁 | 建 线程 

>>>t.start () 妨 动 线程 ,3s 之 后 调用 Geamp 函数 

>>>t.cancel 0 向! 果 仍 在 等 待 时 间 到 达 , 则 取消 


1. join([ timeout] ) 


阻塞 当前 线程 ,等 待 被 调 线程 结束 或 超时 后 再 继续 执行 当前 线程 的 后 续 代 码 ,参数 
timeout 用 来 指定 最 长 等 待 时 间 ,单位 是 秒 。 方 法 join() 返 回 后 再 调用 isAlive( ) 方 法 ,如 
果 得 到 True 则 说 明 线程 仍 在 运行 并 且 join( ) 方法 是 因为 超时 而 返回 的 ,如 果 isAlive( ) 返 
回 False 则 说 明 join( ) 方 法 是 因为 线程 运行 结束 而 返回 的 。 一 个 线程 可 以 调用 多 次 
join( ) 方 法 (如 果 线 程 已 结束 ,join( ) 会 立即 返回 ) ,但 不 允许 对 当前 线程 调用 join( ) ,否则 
会 抛 出 异常 。 
示例 12-1 线程 对 象 的 join( ) 方 法 。 
fram threading import Thread 
inport time 
Gef fancl (xy): 
for i in range (x,y) : 
Print (i,end=" ') 
Print () 
time.slesp (10) 往 待 10s 
t1 “Thread (target -fincl,args =(15,20)) 覃 | 建 线程 对 象 ,args 是 传递 给 函数 的 参数 
t1.start() 妨 动 线程 
蕊 .joinG) 熔 待 线程 电 运行 结束 或 等 待 5s 
t2 =Thread (target =fincl ,args =(5,10)) 
t2.start () 
保存 并 运行 上 面 的 程序 ,首先 输出 15 至 19 这 5 个 整数 ,然后 程序 暂停 5s 以 后 又 继 
续 输 出 5 至 9 这 5 个 整数 。 如 果 把 t. join(5) 这 一 行 注释 或 删除 之 后 再 次 运行 ,两 个 线程 
的 输出 将 会 重 全 在 一 起 ,这 是 因为 两 个 线程 并 发 运行 ,而 不 是 等 待 第 一 个 结束 以 后 再 运行 
第 二 个 。 如果 把 time. sleep( 10) 这 一 行 注释 或 删除 再 运行 ,会 发 现 两 个 线程 的 输出 之 间 没 
有 了 时间 间 隔 ,这 是 因为 线程 对 象 的 join( ) 方 法 当 线 程 运行 结束 或 超时 之 后 返回 ,虽然 指定 
了 超时 时 间 为 5s, 而 实际 上 线程 函数 瞬间 就 执行 结束 了 。 


2. isAlive( ) 
这 个 方法 用 来 测试 线程 是 否 处 于 运行 状态 ,如 果 仍 在 运行 则 返回 True, 如 果 尚 未 启 
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动 或 运行 已 结束 则 返回 False。 
示例 12-2 线程 状态 检测 。 
fram threading import Thread 
inport time 
GEf fncl (): 

time.slesp (10) 


tl Thread (target =foncl) 

Print ('t1:',t1 .isAlive()) 艇 程 还 没有 运行 ,返回 False 
tL.start() 

Print('tl:',t1.isAlive()) 航程 还 在 运行 ,返回 True 
t1.joinG) 前 oin0) 方 法 因 超 时 而 结束 
Print ('t1:',t1.isAlive()) 夏 程 还 在 运行 ,返回 True 
t1.join0) 笠 待 线程 结束 

Print (‘tl:',t1.isAlive()) 航程 已 结束 ,返回 False 
上 面 程序 的 输出 结果 为 

tl: False 

也: True 

也: True 


tl: False 
3. daemon 属性 


在 多 线程 编程 中 ,如 果子 线程 需要 访问 主线 程 中 的 资源 (比如 某 个 变量 ) , 当 退 出 程 
序 时 主线 程 结束 后 这 些 资源 将 不 再 存在 , 子 线程 继续 运行 时 会 因为 无 法 访问 资源 而 引发 
异常 导致 崩溃 。 因 此 ,需要 有 一 种 机 制 保证 主线 程 结束 时 可 以 同时 结束 子 线程 ,或 者 使 得 
主线 程 等 待 子 线程 运行 结束 后 再 结束 ,线程 的 daemon 属性 恰好 能 够 满足 这 样 的 要 求 。 

在 程序 运行 过 程 中 有 一 个 主线 程 , 若 在 主线 程 中 创建 了 子 线程 ,当主 线程 结束 时 根据 
子 线程 daemon 属性 值 的 不 同 会 发 生 下 面 的 两 种 情况 之 一 。 

(1) 如 果 某 个 子 线程 的 daemon 属性 为 False, 主线 程 结束 时 会 检测 该 子 线程 是 否 结 
东 ,如果 该 子 线程 还 在 运行 , 则 主线 程 会 等 待 它 完成 后 再 退出 。 

(2) 如 果 某 个 子 线程 的 daemon 属性 为 True , 主线 程 运行 结束 时 不 对 这 个 子 线程 进行 
检查 而 直接 退出 ,同时 所 有 daemon 值 为 True 的 子 线程 将 随 主线 程 一 起 结束 ,而 不 论 是 否 
运行 完成 。 

属性 daemon 的 值 默认 为 False ,如 果 需 要 修改 ,必须 在 调用 start( ) 方 法 启动 线程 之 前 
进行 设置 。 另 外 要 注意 的 是 ,上 面 的 描述 并 不 适用 于 IDLE 环境 中 的 交互 模式 或 脚本 运 
行 模式 ,因为 在 该 环境 中 的 主线 程 只 有 在 退出 Python IDLE 时 才 终 止 。 

示例 12-3 线程 对 象 的 daemon 属性 。 
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jimport time 


class mythread (threading.Thread) : 账 承 Thread 类 ,创建 自 定义 线程 类 
Gf__init _ (self,nm, threadnane): 
threading.Thread. _init _ (self,name -threacname) 
self.mm=mum 
Gef rn(self): 重 写 nm() 方 法 
Print (self.num 


世 ythreadd 't1') 谢 | 建 自 定义 线程 类 对 象 ,Gaemrn 默 认为 False 
t2 "mythread(5, 't2') 

t .daemn -Te 栅 置 线程 对 象 也 的 daemcn 属性 为 True 
Print (tlL.daercn) 

Print tt2.daercn) 

t1.start() 妨 动 线程 

t2.start () 


把 上 面 的 代码 存储 为 ThreadDaemon. py 文件 ,在 IDLE 环境 中 运行 结果 如 图 12-3 所 
示 ,在 命令 提示 符 环境 中 运行 结果 如 图 124 所 示 。 可 以 看 到 ,在 命令 提示 符 环 境 中 执行 
该 程序 时 ,线程 2 没有 执行 结束 就 跟随 主线 程 一 同 结束 了 ,因此 并 没有 输出 数字 5。 











图 12-3 在 IDLE 环境 中 运行 图 124 在 命令 提示 符 环境 中 运行 


1213 线程 调度 


在 实际 开发 时 ,不 仅 要 合理 控制 线程 数量 ,还 需要 在 多 个 线程 之 间 进 行 有 效 地 同步 和 
调度 才能 发 挥 最 大 功效 。 

引入 线程 技术 的 主要 目的 之 一 是 为 了 充分 利用 硬件 资源 ,尤其 是 提高 CPU 的 利用 
率 , 提 高 系统 的 任务 处 理 速度 和 符 吐 量 , 让 各 个 部 件 都 处 于 高 速 运转 和 忙碌 状态 。 把 任务 
拆 分 成 能 够 互相 协作 的 多 个 线程 同时 运行 ,那么 属于 同一 个 任务 的 多 个 线程 之 间 必 然 会 
有 交互 和 同步 以 便 能 够 互相 协作 地 完成 任务 。 

在 多 核 .多 处 理 器 平台 上 ,在 任意 时 刻 每 个 核 可 以 运行 一 个 线程 ,多 个 线程 同时 运行 
并 相互 协作 ,从 而 达到 高 速 处 理 任 务 的 目的 。 然 而 ,即使 是 高 端 服务 器 或 工作 站 甚至 集群 
系统 ,处 理 器 和 核 的 数量 总 是 有 限 的 ,如 果 线 程 的 数量 多 于 核 的 数量 ,就 必然 需要 进行 调 
度 来 决定 某 个 时 刻 哪 些 线程 可 以 使 用 这 些 有 限 的 资源 。 在 调度 时 ,处 理 器 为 每 个 线程 分 
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配 一 个 很 短 的 时 间 片 ,所 有 线程 根据 具体 的 调度 算法 轮流 获得 该 时 间 片 。 当 时 间 片 用 完 
以 后 ,即使 该 线程 还 没有 执行 完 也 要 退出 处 理 器 等 待 下 次 调度 ,同时 由 操作 系统 按照 优先 
级 再 选择 一 个 线程 进入 CPU 运行 。 在 生命 周期 内 ,一 个 线程 可 能 需要 被 调度 并 执行 很 多 
次 才 会 结束 ,图 12-5 中 椭圆 内 的 上 下 文 开关 次 数 反 映 了 线程 被 调度 的 次 数 。 


= 
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图 12-5 ”WPS 进程 中 某 个 线程 的 属性 


由 于 处 理 器 中 寄存 器 的 数量 有 限 ,而 不 同 的 线程 很 可 能 需要 使 用 到 相同 的 一 组 寄存 
器 来 保存 中 间 计 算 结果 或 运行 状态 。 因 此 ,在 调度 线程 时 必须 要 做 好 上 下 文 的 保存 和 恢 
复工 作 , 以 保证 该 线程 下 次 被 调度 进 处 理 器 后 能 够 继续 上 次 的 工作 ,而 不 是 从 头 重 来 。 虽 
然 一 般 来 说 这 些 工作 并 不 需要 Python 程序 员 操 心 ,但 是 如 果 线 程 太 多 的 话 ,线程 调度 带 
来 的 开销 可 能 会 比 线程 实际 执行 的 开销 还 大 ,这 样 使 用 多 线程 就 失去 本 来 的 意义 了 。 

通过 前 面 的 图 12-3 可 以 发 现 , 操 作 系 统 中 会 同时 存在 大 量 的 线程 ,然而 这 并 不 意味 
着 所 有 线程 都 是 可 调度 的 。 虽 然 系 统 中 同时 会 存在 大 量 的 线程 ,但 是 由 于 优先 级 或 主动 
阻塞 等 原因 ,真正 处 于 可 调度 状态 的 线程 数量 并 不 是 非常 多 ,系统 也 不 会 给 暂时 没事 可 做 
的 线程 分 配 任何 CPU 时 间 。 例 如 ,Python 标准 库 time 中 的 sleep( ) 函数 , 它 的 功能 是 暂停 
(或 者 说 阻塞 当前 线程 ) 指 定时 间 ( 单位 是 秒 ) 。 从 多 线程 编程 和 调度 算法 上 来 讲 , 该 函数 
的 真正 功能 是 告诉 操作 系统 在 一 定 的 时 间 内 不 要 再 调度 自己 了 。 


1214 Lock/RLock 对 象 


Lock 是 比较 低级 的 同步 原 语 , 当 被 锁定 以 后 不 属于 特定 的 线程 。 一 个 锁 有 两 种 状 
态 : locked 和 unlocked, 刚 创建 的 Lock 对 象 处 于 unlocked 状态 。 如 果 锁 处 于 unlocked 状 
态 ,acquire( ) 方 法 将 其 修改 为 locked 并 立即 返回 ;如 果 锁 已 处 于 locked 状态 , 则 阻塞 当前 
线程 并 等 待 其 他 线程 释放 锁 , 然 后 将 其 修改 为 locked 并 立即 返回 。release( ) 方法 用 来 将 
锁 的 状态 由 locked 修改 为 unlocked 并 立即 返回 ,如 果 锁 状态 本 来 已 经 是 unlocked ,调用 该 
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方法 将 会 抛 出 异常 。 

可 重 入 锁 RLock 对 象 也 是 一 种 常用 的 线程 同步 原 语 , 可 被 同一 个 线程 acquire( ) 多 
次 。 当 处 于 locked 状态 时 , 某 线程 拥有 该 锁 ; 当 处 于 unlocked 状态 时 ,该 锁 不 属于 任何 线 
程 。RLock 对 象 的 aequire( )/release( ) 调用 对 可 以 内 套 , 仅 当 最 后 一 个 或 者 最 外 层 的 
release( ) 执行 结束 后 , 锁 才 会 被 设置 为 unlocked 状态 。 

示例 12-4 使 用 Lock/RLock 对 象 实现 线程 同步 。 

import threading 

import time 


柏 定 义 线程 类 
class mythread (threading.Thread) : 
def__init _ (self): 
threading.Thread. _init _ (salf) 
重 写 rm0 方 法 
GEf rn(self): 
Goalx 
砍 取 镇 ,如 果 成 功 则 进入 临界 区 
lock.accuire () 
X13 
Print (x) 
由 出 临界 区 ,释放 锁 
lock.release () 


lock =threacing.RLock() 
地 可 以 使 用 Icck 类 实现 加 锁 和 线程 同步 
机 ock =threading.Iock() 


痉 放 多 个 线程 的 列表 

蕊 = 

for i in range (10): 
覃 建 线程 并 添加 到 列表 
t mythread() 
.apend(t) 


彬 个 线程 互 斥 访问 的 变量 

xz=0 

娘 动 列表 中 的 所 有 线程 

fori intl: 

i.start () 

保存 并 运行 上 面 的 程序 ,依次 输出 3.6.9、12、.15 、18、21、24、27、30 这 几 个 数字 。 把 
lock. acquire( ) 和 lock. release( ) 这 两 行 注释 或 删除 之 后 再 运行 ,会 发 现 多 个 线程 之 间 没 
有 任何 “默契 ”, 输 出 结果 变 得 杂乱 无 章 ,每 次 运行 可 能 会 得 到 不 同 的 结果 。 
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需要 注意 的 是 ,多 线程 同步 时 如 果 需 要 获得 多 个 锁 才 能 进入 临界 区 的 话 ,可 能 会 发 生 
死 锁 , 在 多 线程 编程 时 一 定 要 注意 并 认真 检查 和 避免 这 种 情况 。 例 如 ,下 面 的 代码 就 有 可 
能 发 生死 锁 , 类 似 于 “哲学 家 就 餐 问题 ”。 

jimport time 

Class mythreadl (threading.Thread) : 

Gf__init _ (self): 
threading.Thread. init _ (salf) 


Gef rn (self): 
lock .acouire (0) 碑 取 一 个 镇 
loce.acoqaire0 雁 取 另 一 个 锁 
和 疾 际 功能 代码 略 ) 


loce .release () 
lock .release () 


Class mythread? (threading.Thread) : 

def__init _(self): 

threading.Thread. init _ (self) 
Gef rn(self): 

locke .acouire() 

1ocklL .acouire () 

羔 际 功能 代码 略 ) 

lockd .release () 

lock .release () 


lockl =threacing.FLock() 
1locke threading.RIock() 
世 =ythreacil () 

t2 mythreacp () 

t1 .start() 

t2.start() 


1215 ”Qondtion 对 象 


使 用 Condition 对 象 可 以 在 某 些 事件 触发 后 才 处 理 数 据 或 执行 特定 的 功能 代码 ,可 以 
用 于 不 同 线程 之 间 的 通信 或 通知 ,以 实现 更 高 级 别 的 同步 。Condition 对 象 除了 具有 
acquire( ) 和 release( ) 方法 之 外 ,还 有 wait( ) 、wait_for( ) .notify ( ) 、notify_all( ) 等 方法 。 
其 中 : 

(1) wait( timeout = None) 方 法 释放 锁 ,并 阻塞 当前 线程 直到 超时 或 其 他 线程 针对 同 
一 个 condition 对 象 调用 notify( )/notify_all( ) 方 法 ,被 唤醒 的 线程 会 重新 尝试 获取 锁 并 在 
成 功 获取 锁 之 后 结束 wait( ) 方 法 ,然后 继续 执行 。 





第 12 章 多 任务 与 并 行 处 理 : 线程 .进程 . 协 程 ,分 布 式 .GPU 加 速 = 


(2) wait_for( predicate ，timeout = None ) 方法 阻塞 当前 线程 直到 超时 或 条 件 得 到 
满足 。 
(3) notify(n =1) 唤醒 等 待 该 condition 对 象 的 一 个 或 多 个 线程 ,该 方法 不 负责 释 
放 锁 。 

(4) notify_all( ) 方 法 会 唤醒 等 待 该 condition 对 象 的 所 有 线程 。 

下 面 通过 经 典 的 生产 者 /消费 者 问题 来 演示 Condition 对 象 的 用 法 ,程序 中 生产 者 线 
程 和 消费 者 线程 共享 一 个 列表 ,生产 者 在 列表 尾部 追加 元 素 , 消 费 者 从 列表 首部 获取 并 删 
除 元 素 。 如 果 列 表 长 度 到 了 20 表示 已 满 ,生产 者 等 待 ,如 果 列 表 已 空 则 消费 者 等 待 。 

示例 12-5 使 用 Condition 对 象 实现 线程 同步 。 

fram rancom jmport randint 

fram time jnmport slesp 


相 定 义 生产 者 线程 类 


con.acconire () 
棚 设 共享 列表 中 最 多 能 容纳 20 个 元 素 
if len(x) ==20: 
如 果 共享 列表 已 满 , 生 产 者 等 待 
cn.wait () 
print ("Produoer is waiting……') 
else: 
Print ('Produoer:',end=" ') 
妨 生 新 元 素 , 添 加 至 共享 列表 
x.append (randint (1,1000)) 
Print (x) 
slesp(1) 
路 醒 等 待 条 件 的 线程 
con-notify () 
释放 镇 
an.release() 


相 定 义 消费 者 线程 类 
class Consumer (threading.Thread) : 
Gf init (selfvthreacname) : 
threacling-Thread- init _ (self,nane -threacname) 
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Gef rn (self) : 
glcbal x 
while True: 
睹 取 镇 
con-acoqmire() 
if not x: 
往 待 
con-wait () 
print (Consamer is waiting… ') 
else: 
print (x.pp(0)) 
print (x) 
slespC) 
on.notify() 
con.release() 


枪 | 建 conditicn 对 象 以 及 生产 者 线程 和 消费 者 线程 
con =threacting.Conctiticn () 

x=[] 

P =Produoer ('Produoer') 

C=Cmnsurer (‘Onsumer') 

P.start () 

Co.start () 

P.join(0 

c.join() 


该 程序 运行 结果 如 图 12-6 所 示 。 








=== RESTART: C:\Python 3.5\deno. py ===—=== 





755] 
842, 755, 713] 
755, 713, 73] 
842, 755, 713, 73, 166] 


842 
[755, 713, 73, 166] 

Producer:” [155, 713, 173, 166, 902] 
Producer: [755, 713, 73, 166, 902, 921] 


755 
[713, 73, 166, 902, 921] 

Broducer: [713, 73, 166, 902, 921, 448] 
1 












,921,448,53] 
902, 921, 448, 53, 865] 


3 
[166, 902, 921, 448, 53, 865] 









图 12-6 ”使 用 Condition 实现 线程 同步 


1216 Que 对象 


queue 模块 中 提供 的 Queue 类 实现 多 线程 编程 所 需要 的 锁 原 语 , 是 线程 安全 的 ,不 需 
要 额外 的 同步 机 制 ,尤其 适合 需要 在 多 个 线程 之 间 进 行 信息 交换 的 场合 。Queue 类 对 象 


第 12 章 多 任务 与 并 行 处 理 : 线程 .进程 . 协 程 .分 布 式 .GPU 加 速 = 





329 
® 


的 get( ) 和 put( ) 方 法 都 支持 一 个 超时 参数 timeout, 调 用 该 方法 时 如 果 超 时 会 抛 出 异常 。 
示例 12-6 使 用 Queue 对 象 实现 多 线程 同步 ,模拟 生产 者 /消费 者 问题 。 
import threading 
irport time 
jimport queue 


相 定 义 生产 者 线程 类 
Class Producer (threading.Thread) : 
Gf__init _(self,threadhname): 
threading.Thread. _init _ (self,name -threacname) 
GEf rn(self): 
Pal mwyqheue 
首 队 列 尾部 追加 元 素 
time.slespQ) 
try: 
myqueue-Prt(self.getkeme () ,timeout 1) 
Print (self.getNEme 0，' Put ',self.getNare(),' to queue.') 
Except: 
Fass 


Class Consurer (tHhreading.Thread) : 
def__init _ (self,threadhnare): 
threading.Thread. _init _ (self,name =threacname) 
Gef rn(self): 
Poral myqheue 
三 队列 首部 获取 元 素 
time.slesp(0.1) 
try: 
Print (self.getNEne (), ' get ',myqhere.gt (timeot .1),' 人 om qeve.') 
ExcePE: 
Fass 


TYobeue =queue.Cneue (5) 


覃 建生 产 者 线程 和 消费 者 线程 
plist =[] 
clist =[] 
for i in range (10): 
P=Producer ('Produoer' +str(i)) 
Plist.append (p) 
C=Consumer ("Consumer' +str(i)) 
Clist.append(c) 
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灰 次 启动 生产 者 线程 和 消费 者 线程 
for prc in ziptplist,clist): 
p-start () 
c.start () 


示例 12-7 使 用 Queue 类 实现 多 线程 复制 文件 ,利用 该 类 提供 的 机 制 来 保证 多 个 线 
程 的 同步 。 


inport os 

inport sys 

jimport argparse 

fram queue inport Que 
fram threading inport Thread 


Gef copyFile (src,dst,nm : 
呈 " 使 用 mm 个 线程 复制 src 日 录 下 的 文件 到 sst 目录 中 


话 文 件 夹 必须 存在 
assert os .path.isdir (src) ,src +' mst be an existing directory." 
茹 果 目 标 文件 夹 不 存在 ,创建 一 个 
if not os.path.isdir (Gst) : 
os.makedirs (dst) 
最 多 容纳 10 个 元 素 的 队列 
q=eueuedo) 


GEf acd (src) : 
for £ in os.1istdir (src) : 

£=05.path.join(src, f) 

if os.path.isfile(f): 
往 队 列 中 放 数 据 , 满 了 会 自动 等 待 
-Pt (f) 

elif os.path.isdir (f) : 
-Pt (下 
acdi(f) 


帘 | 建 并 启动 往 队 列 中 存放 元 素 的 线程 
t_acd =Thread (target 一 cargs =(src,)) 
七 act.start () 


Gef opy 0: 
while True: 
srcTtem-q.gat () 
十 srcTtem 一 -None: 
Ireak 
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上 葡 换 字符 串 , 生 成 日 标 路 径 
dstItem=srcTtem.replace (src,dst) 
Print (srcTtem, ' ==>",dstTtem) 
if os.path.isfile (srcTtem) : 
aetpir =05.path.split (dstTtem [0] 
if not os.path.isdir (GstDir) : 
try: 
os .makedirs (dstDir) 
except FilepyistsError as e: 
Fass 
copyfile (srcTtem, dstTtem) 
elif os.path.isdir (srcTtem) : 
try: 
cs.makedirs (dstTbem) 
except FilepxistsError as e: 
Fass 
航 送 完成 信号 
qtask cone () 


创建 指定 数量 的 线程 来 复制 文件 
for i in range (nm : 

t =Thread (target =opy) 

七 .start () 


位 待 所 有 任务 完 
qjoin() 


竺 队列 中 插入 Nane 空 值 ,让 线程 结束 
for i in range (nm) : 


解析 命令 行 参数 

Farser =argparse.ArgumentParser (Gescripticn ="'copy files from src to dst') 
Farser.add argment (' -s"',' — -src')#default ="'C: \\python35') 

Faerser.add argrent (' -d',' — -Gst')#defant ="'D: \\test') 

Farser.add argment(' n',' — um', defarlt ="5') 

args -arser.Parse args() 






if args.src! ne and args.dst! None: 
CoPYEile (args.src,args .dst, int (args.nm) 

else: 
Print ('Please use the following commend to see how to use:') 
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Print(l’ '+sys.argv[0] +" nh') 
把 上 面 的 代码 保存 为 multiThread_copyFile. py ,用 法 如 下 : 


Cs NPython35 >fython mltiThread opyFile.py 十 
usage: mltiThread copyPile-PY [-h] [-s SEC] [-d psr] [nNM 


copy files from src to dst 


cptional arguments: 
hh, - help Show this help message and exit 
-5 SEC, - -src SEC 
-apsmr, - -dst DET 
n NM -um NM 


1217 ”Bent 对 象 


Event 对 象 是 一 种 简单 的 线程 通信 技术 ,一 个 线程 设置 Event 对 象 , 另 一 个 线程 等 待 
Event 对 象 。Event 对 象 的 set( 可 以 设置 Event 对 象 内 部 的 信号 标志 为 真 ;clear( ) 方 
法 可 以 清除 Event 对 象 内 部 的 信号 标志 ,将 其 设置 为 假 ;isSet( ) 方 法 用 来 判断 其 内 部 信号 
态 ;wait( ) 方 法 在 其 内 pA 状态 为 真 时 会 立刻 执行 并 返回 , 若 Event 对 象 的 内 
标志 为 假 , wait( ) 方 法 就 一 直 等 待 至 超时 或 者 内 部 信号 状态 为 真 。 
示例 12-8 ”使 用 Event 对 象 实现 线程 同步 。 


jnmport threading 
















相 定 义 线程 类 
Class mythread (tHhreading.Thread) : 
ef __init (selfvthreacname) : 
threading.Thread. init _ (self,name threadname) 


glcbal myevert 
根据 Byent 对 象 是 否 已 设置 做 出 不 同 的 响应 
if myevent .isSet () : 

myevent.clear () 

往 待 

myevent .wait () 

Print (self.gstName () +' set') 
else: 

Print (self.getNeme 0 +' not set') 

般 置 标志 

myevent .set () 
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myevent threading.Event 0 

役 秆 标志 

myevent. .set () 


for i in range (10): 
t =mythread (str (i)) 
t.start () 
将 上 面 的 代码 保存 为 demo. py 文件 并 多 次 运行 ,会 发 现 每 次 运行 结果 略 有 不 同 ， 
图 12-7 是 其 中 两 次 的 运行 结果 。 





国 仿 信 皖 寺 行 国 会 得 示 符 
:\Python36>python demo. py EC:\Python36>python demo. py 
1 not set 1 not set 
et 
l3 not set not set 
set 
5 not set not set 
not set 
?7 not set set 
Se t 
lB not set not set 








图 12-7 使 用 Event 对 象 实现 线程 同步 


1218 Seraphore 与 BoundedSerrephore 


Semaphore 对 象 维护 着 一 个 内 部 计数 器 ,调用 acquire( ) 方法 时 该 计数 器 减 1, 调 用 
release( ) 方 法 时 该 计数 器 加 1, 适用 于 需要 控制 特定 资源 的 并 发 访问 线程 数量 的 场合 。 
调用 acquire( ) 方式 时 ,如 果 计 数 器 已 经 为 0 则 阻塞 当前 线程 直到 有 其 他 线程 调用 了 
release( ) 方 法 ,所 以 计数 器 的 值 永远 不 会 小 于 0。Semaphore 对 象 可 以 调用 任意 次 release 
() 方 法 (如 果真 的 出 现 这 种 情况 ,很 可 能 是 有 bug) ,而 BoundedSemaphore 对 象 可 以 保证 
计数 器 的 值 不 超过 特定 的 值 。 与 Lock/RLock 、Condition 对 象 一 样 , Semaphore 和 
BoundedSemaphore 对 象 也 支持 上 下 文 管理 协议 ,支持 with 关键 字 。 

示例 12-9 使 用 BoundedSemaphore 对 象限 制 特定 资源 的 并 发 访问 线程 数量 。 

inport threading 

inport time 


GEf worker (value) : 
with sema: 
Print (value) 
time.slesp(8) 


后 一 时 刻 最 多 允许 2 个 线程 访问 特定 资源 
sera —threading.BoundedSemephore C) 
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for i in range (10): 


t threading.Thread (target =—worker,args =(i,)) 
t.start () 


1219 ”Banier 对 象 


Barrier 对 象 常用 来 实现 这 样 的 线程 同步 ,多 个 线程 运行 到 某 个 时 间 点 以 后 每 个 线程 
都 需要 等 着 其 他 线程 都 准备 好 以 后 再 同时 进行 下 一 步 工 作 。 类 似 于 赛马 时 需要 先 用 栅栏 
拦住 ,每 个 试图 穿 过 栅栏 的 选手 都 需要 明确 说 明 自 己 准备 好 了 , 当 所 有 选手 都 表示 准备 好 
以 后 ,栅栏 打开 ,所 有 选手 同时 冲 出 栅栏 。 

下 面 的 代码 创建 了 一 个 允许 3 个 线程 互相 等 待 的 Barrier 对 象 ,每 个 线程 做 完 一 些 准 
备 工 作 后 调用 Barrier 对 象 的 wait( ) 方 法 等 待 其 他 线程 , 当 所 有 线程 都 调用 了 wait( ) 方 法 
之 后 ,会 调用 指定 的 action 对 象 ,然后 同时 开始 执行 wait( ) 之 后 的 代码 。 

inport threading 

inport rancam 

inport time 





GEf worker (arg) : 
根 设 每 个 线程 需要 不 同 的 时 间 来 完成 准备 工作 
time.sleep (rancom.rancint Q,20)) 
和 棚 设 已 知 任何 线程 的 准备 工作 最 多 需要 20s 
每 个 线程 调用 we 让 0 时 ,返回 值 不 一 样 
rp.wait C0) 
ifr==0;: 

Print (arg) 


Gef printok() : 
Print ('ok') 


柄 许 3 个 线程 等 待 
失 果 线程 调用 wa 让 0 时 没有 指定 超时 时 间 , 默 认为 20s 
b =threacing.Barrier (parties 二 ,acticn =printok, timeout =20) 


覃 建 并 启动 3 个 线程 ,线程 数量 必须 与 Barrier 对 象 的 Farties 一 致 
for i in range (3): 
t threading.Thread (target =worker,args =(i,)) 
t.start () 
下 面 的 代码 模拟 了 一 个 类 似 的 场景 ,服务 器 启动 时 需要 一 定 的 时 间 ,在 服务 器 做 好 准 
备 工作 之 前 不 允许 客户 端 发 起 连接 请 求 。 
jimport threading 
inport rancam 
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import time 
bthreading.Parrier ©, timeout =5) 


GEf server() : 
妨 动 服务 器 ,准备 接收 客户 端 连接 ,代码 略 
b.wait () 
while True: 
赚 收 客户 端 连接 ,处 理 客户 端 请 求 ,代码 略 


Gef client() : 
熔 待 服务 器 启动 
b.wait () 
while True: 
肆 立 连接 ,和 服务 器 进行 通信 


粉 别 创建 并 启动 服务 器 线程 和 客户 端 线程 
threading.Thread (target =server) .start () 
threading.Thread (target =client) .start () 


12.2 多 进程 编程 


进程 是 正在 执行 中 的 应 用 程序 。 一 个 进程 是 正在 执行 中 的 一 个 程序 使 用 资源 的 总 
和 ,包括 虚拟 地 址 空间 .代码 ,数据 .对象 句柄 .环境 变量 和 执行 单元 等 。 一 个 应 用 程序 同 
时 打开 并 执行 多 次 ,就 会 创建 多 个 进程 。 

Python 标准 库 multiprocessing 用 来 实现 进程 的 创建 与 管理 以 及 进程 间 的 同步 与 数据 
交换 ,用 法 与 threading 类 似 , 是 支持 并 行 处 理 的 重要 模块 。 标 准 库 multiprocessing 同时 支 
持 本 地 并 发 与 远程 并 发 ,有 效 避 免 了 全 局 解释 器 锁 (Global Interpreter Lock,GIL) 问题 ,可 
以 更 有 效 地 利用 CPU 资源 ,尤其 适合 多 核 或 多 CPU 环境 。 


1221 进程 创建 与 管理 


与 使 用 threading 中 的 Thread 类 创建 线程 对 象 类 似 , 可 以 通过 multiprocessing 中 的 
Process 类 来 创建 一 个 进程 对 象 ,然后 通过 调用 进程 对 象 的 start( ) 方法 来 启动 ,通过 调用 
join( ) 方 法 等 待 一 个 进程 执行 结束 。 

示例 12-10 ”进程 创建 与 启动 。 
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Print ('parent Process: ',05.getppid 0 ) 焦 看 父 进程 的 世 
Print (proosss id:',05.getpid()) 址 看 当前 进程 的 人 
Erint ('hello' ,naeme) 


if_ _ nme _==' main _': 
了 P =Process (target =f,args =("bdb',)) 冶 | 建 进程 
P-start () 妨 动 进程 
P-join0 笠 待 进程 运行 结束 
标准 库 multiprocessing 中 的 很 多 功能 都 要 求 在 命名 空间 __main_ 中 运行 ,因此 在 本 节 
代码 中 的 “让 __name ”= = '_main__':" 最 好 都 要 保留 ,否则 会 引发 异常 而 无 法 正常 执 


行 。 另 外 ,本 节 的 很 多 程序 需要 在 命令 提示 符 环境 中 运行 才能 正常 执行 并 得 到 预期 结果 。 

标准 库 os 中 提供 了 一 些 查 看 进程 属性 的 函数 ,示例 12-10 演示 了 几 个 。 扩 展 库 psutil 
中 提供 了 更 多 的 有 关 方 法 ,附录 H 中 介绍 了 查看 和 结束 特定 进程 的 用 法 。 
1222 进程 同步 技术 

在 需要 协同 工作 完成 大 型 任务 时 ,多 个 进程 间 的 同步 非常 重要 。 进 程 同步 方法 与 线 
程 同步 方法 类 似 , 代 码 稍微 改写 一 些 即 可 ,下 面 以 Lock 对 象 和 Event 对 象 为 例 简 单 演示 
其 用 法 。 

示例 12-11 使 用 Lock 对 象 实现 进程 同步 。 

frcomrultiprocessing inport Process,Iock 


with lock: cck 对 象 支持 上 下 文 管理 协议 


leacsoac0 闻 | 建 锁 对 象 


Process (target =f,args 一 (Lockrnuam ) .start () 
示例 12-12 ”使 用 Event 对 象 实现 进程 同步 。 
frcomrmltiprocessing jmport Process,Event 


Gef f(e,i): 
if e.is set(): 
e-vait () 
Print (hello world',i) 
e.clear() 
else: 
e.set() 
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if_ ne _=="' _main _': 
event () 
for rm in range (10) : 


Process (target =f,args =(e,num) ) .start () 


1223 Poq 对 象 


除了 支持 与 threading 管理 线程 相似 的 接口 之 外 ,multiprocessing 还 提供 了 Pool 对 象 
支持 数据 的 并 行 操作 。Pool 对 象 提 供 了 大 量 的 方法 支持 并 行 操作 ,常用 的 有 : 

(1) apply(func[ , args[ ，kwds] ] ) : 调用 函数 func ,并 传递 参数 args 和 kwds, 同 时 阻 
塞 当前 进程 直至 函数 返回 ,也 数 func 只 会 在 进程 池 中 的 一 个 工作 进程 中 运行 。 

(2) apply_async(func[ , args[ , kwds[ , callback[ , error_callback ] ] ] ] ) : apply( ) 的 
变形 ,返回 结果 对 象 ,可 以 通过 结果 对 象 的 get( ) 方法 获取 其 中 的 结果 ;参数 callback 和 
error_callback 都 是 单 参数 函数 , 当 结 果 对 象 可 用 时 会 自动 调用 callback ,该 调用 失败 时 会 
自动 调用 error_callback。 

(3) map(func, iterable[ ,chunksize] ) : 内 置 函数 map( ) 的 并 行 版 本 ,但 只 能 接收 一 
个 可 和 迭代 对 象 作为 参数 ,该 方法 会 阻塞 当前 进程 直至 结果 可 用 。 该 方法 会 把 欠 代 对 象 
iterable 切 分 成 多 个 块 再 作为 独立 的 任务 提交 给 进程 池 , 块 的 大 小 可 以 通过 参数 chunksize 
(默认 值 为 1) 来 设置 。 

(4) map __async (func ，iterable [ ，chunksize [ ，callback [ ,error_callback ] ] ] ) : 与 
map( ) 方 法 类 似 , 但 返回 结果 对 象 ,需要 使 用 结果 对 象 的 get( ) 方法 来 获取 其 中 的 值 。 

(5) imap(func，iterable[ ，chunksize ] ) : map( ) 方 法 的 惰性 求 值 版 本 ,返回 迭代 器 
对 象 。 

(6) imap_unordered( func, iterable[ ，chunksize] ) : 与 imap( ) 方 法 类 似 , 但 不 保证 结 
果 会 按 参数 iterable 中 原来 元 素 的 先后 顺序 返回 。 

(7) starmap(func ，iterable[ ，chunksize] ) : 类 似 于 map( ) 方 法 ,但 要 求 参 数 iterable 
中 的 元 素 为 迭代 对 象 并 可 解 包 为 函数 func 的 参数 。 

(8) starmap_async (func, iterable[ , chunksize[ ,callback[ ,error_back] ] ] ) : 方法 
starmap( ) 和 map_async( ) 的 组 合 ,返回 结果 对 象 。 

(9) close( ) : 不 允许 再 向 进程 池 提 交 任 务 , 当 所 有 已 提交 任务 完成 后 工作 进程 会 
退出 。 

(10) terminate( ) : 立即 结束 工作 进程 , 当 线 程 池 对 象 被 回收 时 会 自动 调用 该 方法 。 

(11) join( ) : 等 待 工作 进程 退出 ,在 此 之 前 必须 先 调用 close( ) 或 terminate( ) 。 

示例 12-13 并 发 计算 二 维 数组 每 行 的 平均 值 。 

人 romrultiprocessing inport Eool 


GEf £020): 
retum mean (x) 
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if_ rae == _ main _': 


X=[list (range (10)), list (range C0,30)), 
list (range (50,60)), list (range (80,90))] 


with Eool 6) as p: 帘 | 建 包含 5 个 进程 的 进程 池 
Print (p.mep (£,»2)) 群发 运行 
示例 12-14 “并行 计算 列表 中 数值 的 平方 值 。 
cef ECo : 
retm x*x 
if_ ne _==' main _': 


with FolG) asp: 
Print (p.mep (E, [1,2,31)) 


示例 12-15 并 行 判断 100 000 000 以 内 的 数字 是 否 为 素数 ,并 统计 素数 的 个 数 。 


Cef isPrime m) : 
ifn<: 
remo0 
fn==2: 
rebm1 
if not nel: 
TIetum 0 
for i in range 3,int ns# 虽 .5) #1,2): 
if nsi==0: 
retumo0 
rebm1 


if_ nme _==' main _': 


with Pool (5) as p: 
Print (sum(p.map (isPrime, range (100000000) ) )) 


示例 12-16 Pool 对 象 几 种 常用 方法 的 用 法 。 


irport time 
Cef fco: 
rebim x* x 
if_ name ==' min _': 


with Pool (processes 4) as pool: 
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贩 回 结果 对 象 ,可 以 通过 get 0 方法 获取 其 中 的 值 
result =po01 .atply async (f, (10,)) 
Print (result .get (timeout 4)) 
利 接 返回 结果 列表 
Print (pool .mep (f, range (10))) 
是 回 和 迭代 器 对 象 
让 =pool.imep(f,range (10)) 
Erint (next (it)) 
Print (next (it)) 
Print (it .next (timeout 4)) 
雯 人 睡眠 状态 10s 
result =pool .sgPLY async (time.sleep, (10,)) 
证 面 的 代码 会 引发 超时 异常 
Print (result .get (imecut =3)) 


示例 12-17 Pool 对 象 的 方法 在 不 同情 况 下 引发 异常 的 处 理 方法 。 


inport time 
import ranciom 
jimport sys 


GEf calculate (fomc,args) : 
柚 用 mi 或 Plus 函数 计算 结果 并 返回 格式 化 后 的 字符 串 
峰 号 里 的 * 表示 序列 解 包 
result =finc (args) 
retum '{3} says {1}{2} ={0}'.fomat (fnc. _nare _,args,result, 
multiprocessing.current_ Process () .name) 


GEf calculatestar (args) : 
retim calculate ( :ergs) 


Gef ml (ab) : 
time.slesp (0.5 randam.randam()) 
retim a 


Gef Plus (ab): 
time.sleep (0.5 :Yandam.randam()) 
Tebum a Hb 


cef £090: 
朱 x 起 时 该 函数 会 引发 异常 


rebm1.0/(x 5.0) 


Gef test0): 
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覃 建 包含 4 个 进程 的 进程 池 
with mltiprooessing.Pool (4) as pool: 


TASES =[ ful, (i,7)) for i in range (10)] +\ 
[ (elus, (i,8)) for i in range (10)] 


Print ('Testing error handling: ') 
try: 
Print (pool .arply (£, 5,))) 
except ZercDivisicnError: 
Erint (' NbGbt ZeropivisicnError as eqpected from pool .arply () ') 
else: 
raise AsserticrError (‘expected ZercDivisicnError') 


try: 

Print (pool .mep (f, list (range (10)))) 
except ZeroDivisicnError: 

Print (' NbGot ZercDivisicnError as eqpected fram pool .map () ') 
else: 

raise AsserticarError (‘expected ZercDivisicnError') 


try: 

Print (list (pool .jnmep (f, list (range (10))))) 
except ZeroDivisianError: 

Print (' NbGot ZercDivisionError as expected from list (pool .inep()) ') 
else: 

Iaise RsserticnError ('expected ZercDivisicrError') 


it =pool.imep(f, list (range 1.0))) 
for i in range (10): 
try: 
XxX =next (it) 
except ZercDivjisicnError: 
A 
Fass 
except StopIteratian: 


assert i==9 
Print (' \teot ZercDivisionError as epected from IMaprterator.next () ') 
Frint () 
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蛮 试 超时 是 否 正 常 
Frint (Testing MPIYResalt-get () with timeout:',end=" ') 
res po01 .apply_async (caloulate, TASES [0]) 
while True: 
Sys.stcout.fush() 
try: 
Sy5.stdout .write(' Nn\t%® s' %res.get (0.02)) 
break 
except mltiprocessing. TimeoutError: 
sys.stdout .write('.') 
Print () 


Print (Testing ThMeprterator.nest () with timeout:',end=" ') 
it =pool.imep (calculatestar,TRSES) 
while True: 
sys.stcout .Fush() 
try: 
Sy5.stdout .write(' nNn\t% s' %it.next (0.02)) 
expept StopIteratin: 
break 
except mltiprocessing.TimeoutError: 
sys.stdout .write('.') 


Print () 
if_ ne _==' main _' 
mltiprooessing.freeze support () 
test () 
1224 Mnager 对 象 


Manager 对 象 提供 了 不 同 进程 间 共 享 数 据 的 方式 ,甚至 可 以 在 网 络 上 不 同 机 器 上 运 
行 的 进程 间 共 享 数据 。Manager 对 象 控 制 一 个 拥有 list、 dict、 Lock、RLock、Semaphore 、 
BoundedSemaphore .Condition ,Event ,Barrier .Queue ,Value 、 Array 、Namespace 等 对 象 的 服务 
端 进程 ,并 且 人 允许 其 他 进程 通过 代理 来 操作 这 些 对 象 。 

示例 12-18 ”使 用 Manager 对 象 实现 进程 间 数 据 交换 。 


人 romrmltiprocessing jmport Prooess, Manager 


Gef £0,1,t): 
d['nane'] 一 'Dong Euguoy 
dl'age'] 38 


d['sex'] ="Male' 
aq['actiress"] ="Yantai' 


1.reverse() 
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1 menager. list (range (10)) 
t manager.Value ('i',0) 
了 P=Process (target =f,args =(d,1,t)) 
P.start() 
P.join0 
for item in d.items (0 : 
Print (item) 
print 0) 
Print (t.value) 
示例 12-19 ”使 用 Manager 对 象 实现 不 同 机 器 上 的 进程 跨 网 络 共享 数据 。 
(1) 编写 程序 文件 multiprocessing_server. py, 启 动 服务 器 进程 ,创建 可 共享 的 队列 
对 象 。 


fram queve inport Queuoe 


dq-Qevel() 
class QeueManager (EaseManager) : 
Fass 
QueusManaoPr.register ('get. queue',callable =lanbda:q) 


m =QeueManager (actiress =("',30030) , authkey <P'dongfuguo') 
S=m.get_server () 
S.Serve_fcmrever() 


(2) 编写 程序 文件 multiprocessing_clientl. py ,连接 服务 器 进程 .并 往 共 享 的 队列 中 存 
和 人 一 些 数 据 。 


Class QueManager (BassManacPr) : 
Fass 
QeueMenager .register ('get. qeue') 
息 设 服务 器 的 焉 地址 为 10.2.1.2 
m=QeueManager (actiress =("10.2.1.2',30030) ,authkey pb'dongfuguo') 
mcconnect () 
dm.get qheue (0) 
for i in range G) : 
GPL GD) 


(3) 编写 程序 文件 multiprocessing_client2. py ,连接 服务 器 进程 .从 共享 的 队列 对 象 中 
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读 取 数据 并 输出 显示 。 


Class QeueMenager (aseMerager) : 
Fess 
QeueManager .register ('get queue') 
m=QeueManager (adtiress =("10.2.1.2"',30030) ,authikey <P'dongfuguo') 
m.omnect () 
qm.get coneue () 
for i in range (3): 
Print (q.get 0)) 


示例 12-20 ”创建 和 使 用 自 定义 Manager 对 象 与 Proxy 对 象 。 


fram mltiprooessing inport freeze support 
fram mltiprooessing .meanagers jmport PaseManager, BaseProxy 
inport operator 


句 通 类 
Class EDo: 
GEf f(self) : 
Print ('you called FOO.£0)') 
Gef g(self) : 
Print ('you called Fo.g0 ') 
Gef _h(self) : 
Print ('you called Foo. h() ') 


性 成 器 
cef baz (): 
for i in range (10): 
Yield i* 主 


姓 成 器 对 象 的 代理 类 

Class GaneratiorProxy (BaseProxy) : 
__exposed =[' _next _'] 

Gf __iter _ (self): 
Tetbum self 

Gef __next _ (self): 
rebim self. callmethod(' next _') 


白 回 qperator 模 块 的 函数 
dEf get_qperator modaae() : 
retim cperator 
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Class MManager (PaseMenager) : 
Fass 


鞋 册 Feo 类 ,默认 的 公开 成 员 fF0 和 g0 可 以 通过 代理 访问 
MMnager .register ('Fbol ', FbO) 


鞋 册 Fco 类 ,明确 指定 成 员 g0 和 _h0 可 以 通过 代理 来 访问 
MyMenager .register ('FbcP'Eboesxposed=('g hb) ) 


手册 生成 器 函数 Paz, 指 定 代理 类 型 为 GaneratorPrery 
MyMEnacPr.register ("baz ' ,baz, proxytype =GeneratiorProxy) 


屠 册 函数 get_qperator moaale(0, 使 其 可 以 通过 代理 进行 访问 
MyMenager .regi ster ('qperator' ,get_ operator rodme) 


Gef test(): 
menaeger MyManager () 
Tarager.start () 


Print (' —' >20) 

创建 对 象 

卫 anager.Fool () 

桐 用 对 象 成 员 

£1.£() 

£1.g() 

髓 认 对 象 拥有 哪些 可 访问 的 成 员 

assert not hasattr (£1,'_h') 

assert sorted(f1. eqposed ) ==sorted(['f','g']) 


Print (' 一 ' >20) 

2 manager. Fo () 

2.g() 

.hl) 

assert not hasattr (£2, 'f£') 

assert sorted (2. eqposed ) ==sorted(['g'," _h']) 


Print (' —' *20) 
it manager.baz () 
for i in it: 
Frint('<%d>' $i,end=" ') 
Frint () 


Print(' —' 20) 
Pp anager .cperator () 
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Print ('qp.add C3,45) =", cp.add C3,45)) 
Print ('qp.pow C,94) =", cp.pow 2,%4)) 
print ('qp. eqposed ="',qp. exposed ) 


” 破 持 使 用 B2eePyinstauer 和 cx Freeze 打 包 为 winapws 可 执行 程序 
freeze skport0 
test () 


1225 Listener 与 Qiert 对 象 


这 两 个 对 象 是 multiprocessing. connection 模块 提供 的 对 象 , 可 以 在 不 同 机 器 上 的 进程 
之 间 通 过 网 络 直接 传输 整数 .实数 .字符 串 .列表 元 组 .数组 等 各 种 类 型 的 信息 。 
示例 12-21 使 用 Listener 于 Client 对 象 在 不 同 机 器 之 间 传 递 信息 ,用 来 验证 服务 端 
是 否 存活 。 
服务 端 或 监听 端 程序 代码 如 下 : 
fram mltiprooessing.omnection irport Listener 
fram time inport sleep 
with Listener (('',6060) ,authkey Pb'dongfiuguo') as listener: 
with listener.acospt () as om: 
Print (‘ommnectin acoepted from', listener.last acospted) 
i=0 
while True: 
mn.send( ('Server js alive',i)) 
主 + 习 
slespG) 
客户 端 代码 如 下 : 
fram mitiprooessing.omnection jmport Client 


with Client(('10.2.1.2',6060) ,authkey <P'dngfuguo') as oom: 
while True: 
Print (com.recv()) 


1226 进程 间 数 据 交换 与 共享 


除了 使 用 前 几 节 介绍 的 Manager 对 旬 .Listener 与 Client 对 象 在 不 同 进程 之 间 进 行 数 
据 交 换 与 共享 ,Queue 对 象 和 Pipe 也 常用 来 完成 类 似 任务 。 

示例 12-22 使 用 Queue 对 象 在 进程 间 交 换 数 据 ,一 个 进程 把 数据 放 入 Queue 对 象 ， 
另 一 个 进程 从 Queue 对 象 中 获取 数据 。 使 用 Queue 对 象 在 进程 间 交 换 信息 时 ,必须 要 保 
证 放 入 队列 中 的 所 有 数据 都 被 取 走 ,否则 可 能 会 导致 死 锁 。 
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inport multiprooessing as mp 


cef foo(g): 
-prt (‘hello world!') 

if_ ne ==' main _': 

nmp.set start method('spamn') 

q=mp-Qneue0 

Pp Pp.Prooess (target =foo,args =(g,)) 

p.start () 

Frint (q.get (0)) 

P.join(0 


把 数据 放 入 队列 


和 incpws 系统 创建 子 进程 的 默认 方式 


谢 | 建 进程 ,把 zeue 对象 作 为 参数 传递 


扒 队 列 中 获取 数据 


下 面 的 代码 演示 了 更 加 复杂 的 情形 ,当前 进程 负责 向 队列 中 提交 任务 , 子 进程 负责 进 


~ 


inport time 
inport rancom 


了 相应 的 计算 ,并 通过 另 一 个 队列 把 计算 结果 返回 给 当前 进程 。 


fran mltiprooessing import Process,Qneue,current Process, freeze support 


GEf worker (task_queve, output) : 


峙 续 执行 task qheue-get0, 直 到 取 到 'SToP" 
for finc,args in iter (task queue.get, 'SICP'): 
册 用 相应 的 函数 ,并 将 计算 结果 放 入 队列 


result =caloulate (finc, args) 
cutp 七 .Put (result) 


GEf calculate (fanc,args) : 
result =fimc (ergs) 
Tetbmm '%s says that $s%s=%s"' %\ 


(Current_ Process () .nane,finc. name _,args,result) 


GEf ml (ab) : 
time.slesp (0.5* randam.randam()) 
retmaP 


Gef plus (avb) : 
time.slesp (0.5* randoam.randam()) 
TIEbam a Hb 


Gef test(): 
NMEER CF FFOCESSPS 二 


TSFSI =[ ol, (1,7)) for i in range (10)] 
TSFs2 =[ (plus, (i,8)) fr i in range (10)] 
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利 建 qxeue 对象 
task qee Qeel) 
Gre qee Qee() 


逢 建 并 启动 进程 
for i in range NIMEER. CE FFOCESSES) : 
Process (target worker, args =(task_queue,done queve)) .start () 


龌 交 任务 
for task in TASKS1: 
task qhneue.Put (task) 


答 出 计算 结果 

Print ("Unordered results:') 

for i in range Qen (TASEKS1)) : 
Print (' \t',dne queue.get()) 


棍 交 更 多 任务 
for task in TSKS2: 
task queue.Put (tasko) 


答 出 更 多 结果 
for i in range (len (TIASKS?)) : 
Print(' tdone queue.get ()) 


由 送 停止 信号 


for i in range NUMEER OF FFOCESSES) : 
task _ queue.PIE('STCP'") 


另外 ,也 可 以 使 用 上 下 文 对 象 context 的 Queue 对 象 实现 不 同 进程 间 的 数据 交换 。 
import rultiprocessing as rp 


def fo : 
gpt (bello world’) 





if_ _ nme ==' main _ 
ctx -mp-geE_contest ('spamn') 
q=ctx-Qneue0 
了 P=tx.Process (target =foo,args =(g,)) 
p-start () 
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Print (q-get 0) 
P-join0 
示例 12-23 使 用 管道 实现 进程 间 的 数据 交换 。 管 道 有 两 个 端 ,一 个 接收 端 和 一 个 发 
送 端 ,相当 于 在 两 个 进程 之 间 建 立 了 一 个 用 于 传输 数据 的 通道 。 


Gef f(conn) : 
Com.send('hello world') 和 管道 中 发 送 数据 
com.clcee() 砍 闭 管道 
if_ nm _==' min _': 
Farent_connv hild conn =Pipe() 覃 建 管道 对 象 
p=Prooess (target =f,args =(child_com,)) ”将 管道 的 一 方 作为 参数 传递 给 子 进程 
p-start () 
P-join() 
Print (parent. ccm.recv()) 师 过 管道 的 另 一 方 获取 数据 


Farent_om.close() 
示例 12-24 使 用 共享 内 存 实现 进程 间 数 据 传递 ,比较 适合 大 量 数 据 的 场合 。 
frcomrultiprocessing jimport Process,Value,Array 


Gef fa): 
n.value 3.1415927 
for i in range (len(a)): 
a[li] i] * a[i] 


nmValue('d',0.0) 徕 型 
arr Array ('i',range (10)) 甫 型 数组 
PProoess (target =f,args =(nm arr)) 樟 建 进程 对 象 


1227 标准 库 subprooess 


标准 库 subprocess 允许 创建 子 进 程 , 连 接 子 进程 的 输入 输出 管道 ,并 获得 子 进程 的 返 
回 码 , 也 是 常用 的 并 发 执行 技术 之 一 。 该 标准 库 提供 了 run( ) .call( ) 和 Popen( )3 种 不 同 
的 函数 用 来 创建 子 进程 ,其 中 run( ) 函数 会 阻塞 当前 进程 , 子 进程 结束 后 返回 包含 返回 码 
和 其 他 信息 的 CompletedProcess 对 象 ;call( ) 函数 也 会 阻塞 当前 进程 , 子 进程 结束 后 直接 
得 到 返回 码 ;Popen( ) 函数 创建 子 进 程 时 不 阻塞 当前 进程 ,直接 返回 得 到 Popen 对 象 , 通 过 
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该 对 象 可 以 对 子 进程 进行 更 多 的 操作 和 控制 。 例 如 ,Popen 对 象 的 kill( ) 和 terminate( ) 方 
法 可 以 用 来 结束 该 进程 ,send_signal( ) 可 以 给 子 进程 发 送 指定 信号 ,wait( ) 方 法 用 来 等 待 
子 进程 运行 结束 ,pid 用 来 表示 子 进程 的 ID 号 ,等 等 。 

>>>p ubprooess .Ropan('c: \\Windows \\potepad.ee') ” 利 建 并 运行 子 进 程 


>>>p.pid 峙 程 也 

2744 

>>>p.JG110 壬 束 进程 
12.3 协 程 


协 程 的 概念 有 两 种 含义 : 用 来 定义 协 程 的 函数 ,此 时 也 可 称 为 协 程 函数 ; @ 调 用 
协 程 函数 得 到 的 协 程 对 象 , 表 示 一 个 最 终 会 完成 的 计算 或 者 IO 操作 。 

协 程 的 引入 使 得 编写 单线 程 并 发 代码 成 为 可 能 ,事件 循环 在 单个 线程 中 运行 并 在 同 
一 个 线程 中 执行 所 有 的 回调 函数 和 任务 , 当 事 件 循环 中 正在 运行 一 个 任务 时 ,该 线程 中 不 
会 再 同时 运行 其 他 任务 ,一 个 事件 循环 在 某 个 时 刻 只 运行 一 个 任务 。 但 是 如 果 该 任务 执 
行 yield from 语句 等 待 某 个 Future 对 象 的 完成 , 则 当前 任务 被 挂 起 ,事件 循环 执行 下 一 个 
任务 。 当 然 ,不 同 线程 中 的 事件 循环 可 以 并 行 执行 多 个 任务 。 

在 语法 形式 上 , 协 程 可 以 通过 async def 语句 或 生成 器 来 实现 ,如 果 不 需要 考虑 和 旧 
版 本 Python 兼容 的 话 ,应 优先 考虑 前 者 ;基于 生成 器 的 协 程 函 数 需 要 使 用 @ asyncio. 
coroutine 进行 修饰 ,并 且 使 用 yield from 而 不 是 yield 语句 。 

Future 类 代表 可 调用 对 象 的 异步 执行 ,Task 类 是 Future 的 子 类 ,用 来 调度 协 程 ,负责 
在 事件 循环 中 执行 协 程 对 象 ,如 果 在 协 程 中 使 用 yield from 语句 从 一 个 Future 对 象 中 返回 
值 的 话 ,Task 对 象 会 挂 起 协 程 的 执行 并 且 等 待 Future 对 象 的 完成 , 当 Future 对 象 完 成 后 ， 
协 程 会 重新 启动 并 得 到 Future 对 象 的 结果 或 异常 。 

与 普通 函数 不 同 , 调 用 一 个 协 程 函数 并 不 会 立刻 启动 代码 的 执行 ,返回 的 协 程 对 象 在 
被 调度 之 前 不 会 做 什么 事情 。 启 动 协 程 对 象 的 执行 有 两 种 方法 : 在 一 个 正在 运行 的 协 
程 中 使 用 await 或 者 yield from 语句 等 待 协 程 对 象 的 返回 结果 ; @ 使 用 ensure_future( ) 函 
数 或 者 AbstractEventLoop. create_task( ) 方 法 创建 任务 (Task 对 象 ) 并 调度 协 程 的 执行 。 

示例 12-25 在 单线 程 中 使 用 事件 循环 同时 计算 多 个 整数 的 阶乘 。 


inport asyncio 


async Gef factorial (name, nnber) : 
E 寺 
for i in range Cnmber #1): 
Print ("Task $ s: Corpute factorial (% s):…" $ (name,i)) 
avait asyncio.sleep (0.5) 
王 *# 一 
Print ("Task $s: factorial ($s) =%s" $ (name,nnber,f)) 
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lop asyncio.get event locp() 

tasks =[asyncio-ensure future (factorial ("A",14)), 
asyncio.ensure future (factorial ("B",13)), 
asyncio-ensure fire (factorial ("C",16))] 

lop.rn until onplete (asyncio.gather ( asks)) 

locp.close() 


在 上 面 的 代码 中 ， asyncio. get _event _loop ( ) 函数 用 来 返回 当前 上 下 文中 实现 
AbstractEventLoop 接口 的 事件 循环 对 象 。asyncio. gather( ) 函数 用 来 返回 一 个 从 给 定 的 协 
程 对 象 或 Future 对 象 得 到 的 聚集 结果 ,要 求 所 有 的 Future 对 象 共 享 同 一 个 事件 循环 ,如 


果 所 有 任务 都 顺利 完成 ,该 函数 返回 结果 列表 。 
示例 12-26 显示 当前 日 期 时 间 。 
inport asyncio.subprocess 
irport sys 


@ asyncio.corcoutine 
Gef get_ cate(): 
code =" inport datistime; print (Gatietime.datetime.now())" 


创建 子 进程 ,并 把 标准 输出 重 定向 到 管道 

Create asyncio.create subprocess_ exec (sys.executable, ' -c',oode, 
Stdout 一 syncio.subprocess.PIEFE) 

Proc =yield from create 


赎 取 一 行 输出 
ata =yield from proc.stoout .readline () 
line -ata.decode (‘ascii') .rstrip() 


往 待 子 进程 退出 
Yield from proc.wait () 
retim line 


if sys.platfom==Win32": 
lo =asyncio.ProactorEventIop() 
asyncio.set_ event lo (lccp) 
else: 
loop -asyncio.get event loqp0 


date ogp.rn until corplete (get date()) 
Print ("Qnrent date: $s" $date) 
lccp-close0 


示例 12-27 使 用 协 程 计算 阶乘 。 
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jimport asyncio 
import qperator 
jimport finctools 
@ asyncio.coroutine 
aef slow aperatian (fubire,n) : 

yield fram asyncio.slesp (1) 

result =finctools.reduce (aqperator .ml,range (1l,n 1)) 

般 置 计算 结果 

future.sset result (result) 


lop esyncio.get event loop() 

future asyncio.Fubre() 

攀 | 建 并 启动 任务 ,计算 50 的 阶乘 
asyncio.ensure fulire (slow aperaticn (fubmey50)) 
lop.rmn until complete (future) 

答 出 计算 结果 

Print (future.result0) 

locp.close() 


示例 12-28 在 事件 循环 中 执行 函数 。 
jnmport asyncio 
GEf hello world (lomp): 

Erint ('Hello World') 

结束 事件 循环 

lop.stop() 


loqp asyncio.get event loop() 


症 指 定 的 事件 循环 中 执行 函数 
lop.call som hello worlg, lcop) 


#- 直 运行 事件 循环 ,阻塞 当前 线程 ,直到 调用 loop.stop0 
oop.run_ forever() 
loop.close(0 


12.4 concurrent. futures 模块 提供 的 并 发 执行 功能 


concurrent. futures 模块 提供 了 异步 执行 的 高 级 接口 ,可 以 通过 ThreadPoolExecutor 实 
现 线程 的 异步 执行 ,也 可 以 通过 ProcessPoolExecutor 实现 进程 的 异步 执行 ,两 者 都 继承 自 
抽象 类 Executor ,提供 了 相同 的 接口 。 

(1) submit ( fn ，sargs, * 冰 wargs ) 用 来 调度 可 调用 对 象 fh 并 为 其 传递 参数 args 和 
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kwargs ,返回 一 个 Future 对 象 。 

(2) map(func ,siterables ，timeout = None ，chunksize =1) 是 与 内 置 函 数 map (func, * 
iterables ) 等 价 的 异步 执行 方法 ,多 个 fune 的 调用 可 以 并 发 执行 。 

(3) shutdown( wait = True) 方 法 通知 Executor 对 象 执行 完 当 前 Future 对 象 之 后 释放 
所 有 资源 ,如 果 和 参数 wait 为 True , 则 shutdown( ) 方法 等 待 执行 结束 并 释放 有 关 资 源 之 后 
再 返回 ,否则 立即 返回 。 

示例 12-29 ”使 用 ThreadPoolExecutor 把 C:\test 中 的 所 有 文件 批量 复制 D: \test 文件 
夹 ,假设 目标 文件 夹 D:\test 已 存在 。 


fram ccncurrert.futures jmport ThreacPoolExecutor 
fram shutil inport copy 

fram cs import 1listdir 

fram cs-path import isfile, join 


with ThreadpoolEwecutor (rex_ workers 4) as e: 
for £ in (fn for fn in listdir('C: \\test')): 
src =join('C: \\test',f) 
if isfile(src) : 
dst =join('D: \\test',f) 
e.Smit (Copy src, dst) 


示例 12-30 ”使 用 ProcessPoolExecutor 批量 快速 判断 素数 。 


fram onorrent .fures jmport ProoessPoolEwector 


FRIMES =[1099726899285419, 112582705942171, 
112272535095293,115280095190773, 
115797848077099, 9000099011] 


GEf isPrime n): 
if 2==0: 
retim False 


for i in range (3,int Nn* 间 .5) ,2): 
if nsi==0: 
retum False 
retim True 


Gef rain(): 
with ProcessPoolEwecutor () as executor: 
for nmiber, prime in zip (FRIMES, eecutor .mep (isPrime, FRIMES) ) : 
Print (da is prime: $s' gs (nnber,prime)) 
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12.5 pySpark 并 行 计算 与 分 布 式 计算 框架 


Spark 是 一 个 开源 的 、 通 用 的 并 行 计算 与 分 布 式 计算 框架 ,其 活跃 度 在 Apache 基金 会 
所 有 开源 项 目 中 排 第 三 位 ,最 大 特点 是 基于 内 存 计算 ,适合 迭代 计算 ,兼容 多 种 应 用 场景 ， 
同时 还 兼容 Hadoop 生态 系统 中 的 组 件 , 并 且 具 有 非常 强 的 容错 性 。Spark 的 设计 目的 是 
全 栈 式 解决 批 处 理 .结构 化 数据 查询 . 流 计算 .图 计算 和 机 器 学 习 等 业务 和 应 用 ,适用 于 需 
要 多 次 操作 特定 数据 集 的 应 用 场合 。 需 要 反复 操作 的 次 数 越 多 ,所 需 读 取 的 数据 量 越 大 ， 
效率 提升 越 大 。 

Spark 集成 了 Spark SQL( 分布 式 SQL 查询 引擎 ,提供 了 一 个 DataFrame 编程 抽象 ) 、 
Spark Streaming( 把 流 式 计算 分 解 成 一 系列 短小 的 批 处 理 计算 ,并 且 提 供 高 可 靠 和 吞吐 量 
服务 ) .MLlib( 提供 机 器 学 习 服 务 ) .GraphX( 提供 图 计算 服务 ) SparkR(R on Spark ) 等 子 
框架 ,为 不 同 应 用 领域 的 从 业者 提供 了 全 新 的 大 数据 处 理 方式 , 越 来 越 便捷 轻松 。 

为 了 适应 迭代 计算 ,Spark 把 经 常 被 重用 的 数据 缓存 到 内 存 中 以 提高 数据 读 取 和 操 
作 速 度 , 比 Hadoop 快 近 百 倍 , 并 且 支 持 Java、Scala、Python、R 等 多 种 语言 。 除 map 和 
reduce 之 外 ,Spark 还 支持 filter foreach 、reduceByKey .aggregate 以 及 SQL 查询 流 式 查 
询 等 。 

随 着 普通 家 用 计算 机 (手机 也 早已 进入 多 核 时 代 , 但 如 何在 手机 上 搭建 Spark 环境 不 
在 本 书 讨论 范围 之 内 ) 进入 多 处 理 器 和 多 核 时 代 , 完 全 可 以 在 自己 家 的 计算 机 上 搭建 
Spark 环境 。 当 然 ,如 果 数 据 量 大 到 一 定 程度 的 话 ,还 是 要 在 集群 或 云 平台 上 部 署 的 Spark 
环境 中 进行 处 理 和 计算 。 进 行 Spark 应 用 开发 时 一 般 是 先 在 本 地 进行 开发 和 测试 ,通过 
测试 后 再 提交 到 集群 执行 。 下 面 我 们 以 Windows 7 平台 为 例 介绍 Spark 环境 的 搭建 和 简 
单 使 用 。 首 先 安装 JDK 并 配置 环境 变量 path ,下 载 安 装 Scala 语言 包 并 配置 系统 环境 变 
量 path ,下 载 安 装 Spark 并 配置 系统 环境 变量 HADOOP_HOME 和 SPARK_HOME 的 值 为 
Spark 安装 目录 ,使 用 pip 工具 安装 扩展 库 py4j ,到 网 址 http://public-repo-1. hortonworks. 
com/hdp-win-alpha/ winutils. exe 下 载 winutils. exe 放 到 Spark 安装 目录 的 bin 文件 夹 中 ,最 
后 进入 命令 提示 符 环境 并 切换 到 Spark 安装 目录 的 bin 子 文件 夹 ,执行 命令 pyspark. cemd ， 
进入 Python 开发 环境 ,如 图 12-8 所 示 。 可 以 看 到 ,Spark 不 仅 可 以 使 用 pyspark 库 ,还 可 以 
使 用 Python 标准 库 和 已 安装 的 扩展 库 。 

扩展 库 pyspark 提供 了 SparkContext( Spark 功能 的 主要 入 口 ,一 个 SparkContext 表示 
与 一 个 Spark 集群 的 连接 ,可 用 来 创建 RDD 或 在 该 集群 上 广播 变量 ) .RDD( Spark 中 的 基 
本 抽象 ,弹性 分 布 式 数据 集 Resilient Distributed Dataset) Broadcast( 可 以 跨 任务 重用 的 广 
播 变 量 ) .Accumulator( 共享 变量 ,任务 只 能 为 其 增加 值 ) .SparkConf( 用 来 配置 Spark) 、 
SparkFiles( 访问 任务 的 文件 ) StorageLevel( 更 细 粒 度 的 缓冲 永久 级 别 ) 等 可 以 公开 访问 的 
类 ,并 且 提 供 了 pyspark. sql .pyspark. streaming 与 pyspark. mllib 等 模块 与 包 。 

另外 ,在 Spark 的 bin 文件 夹 中 还 提供 了 spark-submit. cmd 文件 ,这 个 文件 是 用 来 执 
行 Python 程序 的 ,使 用 任意 Python 开发 环境 编写 程序 文件 hello. py, 其 中 只 有 一 行 代码 : 
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国 CWINDOWS\system32\emd.exe po 
i i 
Be "ee 
一 -一 八 ,_/-/ /-/ 作 \ version 2.0.2 


sing Python version 3.5.2, (v3.5,2:4def2a2901a5, Jun 25 2016 22:18:55) 
parkSession available as 'spark . 

>> import math 

>> math. sin(3) 

. 1411200080598672 

>> srom PIL import Jmage 





图 12-8 ”pyspark 开发 界面 


Erint ('Hello worlg') 
然后 在 命令 提示 符 环 境 中 提交 该 程序 即 可 执行 ,如 图 12-9 所 示 。 





BC\WINDOWS\system3Z\cmd.exe 


:\spark-2. 0. 2-bin-hadoop2. 7\bin>spark-submit. cmd hello. py 
el1o world 


:\spark-2. 0. 2-bin-hadoop2. 7\bin> 
图 12-9 ”执行 Python 程序 


下 面 的 Python 程序 文件 pi. py 用 来 估算 圆周 率 的 值 ,保存 至 Spark 安装 目录 中 的 bin 
目录 中 ,可 以 使 用 命令 spark-submit. cmd pi. py 运行 程序 并 输出 圆周 率 的 值 。 





fram pystark jmport SparkConf,SparkContbes 廿 
fram pyspark. sq jmport SQLContes 
fram rancom inrport rancom 


conf -Sparkconf () .setAaprName ("pi") 
Sc =SparkContesxt (conf -cnf) 
sctx =S Ontiext (sc) 


GEf sample (Pp): 
xrYy=ancom()v,zancom() 
rebm]1 if x*x +y*y< else0 


NM SAMETES 400000 数值 越 大 结果 越 准确 
count =sc.parallelize (range NOM SAMFTES)) 
count =count map (sanple) .reGuce (lanbda a,b: a tp) 


Print (' =" * 30) 
Print ("Pi js roughly $f£" % (4.0 scount/NOM SAMPTES)) 


Print (' =" * 30) 
下 面 的 代码 使 用 Spark 来 统计 100 000 000 以 内 的 素数 数量 ,在 6G RAM 双核 CPU 
的 64 位 Win 7 + spark 单机 平台 上 运行 时 间 为 765. 015 428s。 
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fram pyspark import Sparkconf,Sparkcontest 


conf -Sparkconf () .st Nene ("isPrime") 
Sc =SparkContest (conf =onf) 


for i in range (G3,int ms* 虽 .5) 2,2): 
if nsi==0; 
retim False 

retum True 
rcd=sc.parallelize (range (100000000)) 
result =rcod.filter (isPrime) .coont () 
Print (' =" * 30) 
Erint (result) 


下 面 的 代码 在 相同 的 平台 上 使 用 传统 的 方式 来 求解 同一 个 问题 ,运行 时 间 为 
1666.616 000 18s, 由 此 可 见 , 即 使 是 在 单机 多 核 环 境 下 ,Spark 也 会 获得 速度 上 的 很 大 提 
高 ,提高 的 比例 和 处 理 器 的 数量 有 一 定 的 关系 。 


irport time 


GEf isPrime (n): 
ifn<: 
retim False 
ifn==2: 
retim True 
if not nal: 
retim False 
fer i in range (3,int Mm*0.5) +2,2): 
if nsi==0: 
retum False 
retim True 


start time.time() 

mm=sum(l for n in range (100000000) if isprime (n)) 

Print nm) 

print (time.time () -start) 

下 面 的 代码 使 用 筛选 法 实现 了 同样 的 功能 ,但 空间 占用 非常 大 ,在 实际 应 用 中 并 不 
推荐 。 
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fram pyspark import Sparkonf, SparkOontbiesct: 
ram randm import randam 


conf =Sparkconf () .setappNene ("isPrime") 
sc -Sparkcontext (onf =onf) 

了 本 000 

m=int In* 间 .5) 世 
rcd=sc.parallelize (range C,n)) 


result =set () 
while True: 
黎 取 第 一 个 元 素 
t=rd.first() 
ift>m: 
break 
result .acd(t) 
寻 RCD 上 的 所 有 元 素 进行 过 滤 .筛选 ,能 被 整除 的 全 部 过 滤 掉 
rcd =sc.parallelize (rcd.filter (lanbda x: 2%t ! =0) .collect ()) 


Print (list (result) +rod.collect ()) 


下 面 的 代码 演示 了 pyspark 的 很 少 一 部 分 功能 和 用 法 ,更 加 详细 的 函数 介绍 请 参考 
网 址 http://spark. apache. org/ docs/ latest/ api/ python/ pyspark. html。 


>>>fram pyspark irport SparkFiles 

>>>Path ='test.tixt' 

>>>with cpen (path, 'w') as ff: 覃 建文 件 
fp-write('100') 

>>>sc.acdoFile (path) 能 交 文件 


>>>Gef finc (iterator) : 
with apen (SparkEiles.get ("test.txt')) as 名: ”打开 文件 
Val =int (fp.readline ()) 嫌 取 文件 中 的 内 容 
reim [x Wal for x in iterator] 
>>>sc.parallelize ([1,2,3,4,5]) .mepPartitions (finc) .oollect () 
几 行 处 理 ,collect (返回 包含 BD 上 所 有 元 素 的 列表 


[100,200,300, 400,500] 

>>>sc.parallelize ([2,3,4]) .count 0 ount 0) 用 来 返回 RED 中 元 素 的 个 数 
arallelize 0 用 来 分 布 本 地 的 Pythan 集 合并 创建 ED 

3 

>>>rcod =sc.parallelize([1,2]) 

>>>sorted (red.cartesian (rd) -collect ()) jllect(0 返 回 包含 RCD 中 元 素 的 列表 

[QD 0,2), 21), 2,2)] #artesian() 计 算 两 个 FRED 的 笛 卡 儿 积 

>>>rcd =sc.parallelize ([1,2,3,4,5]) 

>>>rcd.filter (lanbda x: x $2=-0) .collect () 可 保留 符合 条 件 的 元 素 


[2,4] 
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>>>sorted (sc.parallelize ([,1,2,3]) .distinct 0 -collect 0) 由 回 唯一 元 素 
[1,2,3] 
>>>rcd =sc.parallelize (range (10)) 
>>>rcd.mep (lanbda x: str Go) -collect () 扫射 
>>>rcd =sc.parallelize ([1.0,5.0,43.0,10.0]) 
>>>rcd.max() 最 大 值 
43.0 
>>>rdamax (Key =str) 
5.0 
>>>rcd.min() 报 小 值 
1.0 
>>>rcd.sum() 新 有 元 素 求 和 
59.0 
>>>fram Tancom jmport rancint 
>>>1st =[randint 0,100) for _ in range (20)] 
>>>1st 
[18,55,48,13,86,23,85,62,66,58,73,96,90,16,49,98,49,69,3,53] 
>>>sc.parallelize (1st) .top G) 报 大 的 3 个 元 素 
[98,96,90] 
>>>sorted (1st, reverse =True) [:3] 
[98,96,90] 
>>>sc.parallelize (range (100)) .filter (lanbda x:x >90) .take (3) 

辣 用 tae0 返 回 前 3 个 元 素 
[91,92,93] 
>>>sc.parallelize (range (0) ,3) .glam() .collect () 收看 分 片 情况 
[[0,1,2,3,4,5], [6,7,8,9,10,11,12], [13,14,15,16,17,18,19]] 
>>>sc.parallelize (range (20) ,6) .glam() -collect () 性 看 分 片 情况 
[[0,1,2], [3,4,5], [6,7,8,9], [10,11,12], [13,14,15], [16,17,18,19]] 
>>>mVRCD =sc.parallelize (range (20) ,6) 上 5 表示 分 片 数 
>>>sc.runJdb tyFCD, lanbda part: [x **2 for x in part]) 执行 任务 
[0,1,4,9,16,25,36,49,64,81,100,121,144,169,196,225,256,289, 324,361] 
>>>sc. rinJcb tryRrD, lanbda part: [x **2 for x in part], [1]) 


惧 查 看 第 2 个 分 片 的 结果 
[9,16,25] 
>>>sc.rnJb (mVRDD, lanbbda part: [x **2 for x in part], [1,5]) 

但 看 第 2 和 第 6 个 分 片上 的 结果 

[9,16,25,256,289,324,361] 
>>>sc.parallelize ([1,2,3,3,3,2]) -distinct () .collect 0 istinct 0 返回 包含 唯一 元 素 的 RD 
[1,2,3] 
>>>fram aperator inport actvrol 
>>>sc.parallelize ([1,2,3,4,5]) .fold(0,aco) 把 所 有 分 片上 的 数据 累加 
二 
>>>sc.parallelize ([1,2,3,4,5]) .foldd ,mn) 把 所 有 分 片上 的 数据 连 乘 


120 
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>>>sc.parallelize ([1,2,3,4,5]) .recuce (ac #ecace 0 函数 的 并 行 版 本 
节 
>>>sc.parallelize ([1,2,3,4,5]) .reduce en) 
120 
>>>result =sc.parallelize (range (1,6)) .grorBy (arbda x: x%3) -collect () 
寻 所 有 数据 进行 分 组 

>>>for kv in result: 

Print dc sorted (V)) 


0 0G] 

1 [1,4] 

2 ,5] 

>>>rcdl =sc.parallelize (range (10)) 

>>>rcbP =sc.parallelize (range (5,20)) 

>>>rcal .intersecticn (rorp) .collect () 次 集 

[8,9,5,6,7] 

>>>rcdl .aibtract (rcbP) .collect () 丸 集 

[0,1,2,3,4] 

>>>rcHl .unicn (rdp) .collect () 俗 并 两 个 FD 上 的 元 素 
[0,1,2,3,4,5,6,7,8,9,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19] 

>>>rddl =sc.parallelize('abod') 

>>>rdp =sc.parallelize (range (4)) 

>>>rcdl .zip (rdcp) .collect () 两 个 FED 必须 等 长 
[('a',0), (bl), (rc',2), ('d',3)] 

>>>rcd =sc.parallelize ('abod') 


>>>rcH.mep (laribca x: (x,1)) .collect 0) 购 先 函数 mp0 的 并 行 版 本 
[alD), (pv (co ('d',1)] 
>>>sc.parallelize ([1,2,3,4,5]) .stdev() 材 算 标准 差 


1.4142135623730951 

>>>sc.parallelize ([1,1,1,1,1]) .stoev() 

0.0 

运行 一 下 上 面 的 代码 会 发 现 , 屏 幕 上 会 出 现 非常 详细 的 执行 过 程 ,实际 上 很 多 时 候 我 
们 并 不 需要 那些 信息 ,只 想 关 心 代 码 的 执行 结果 。 如 果 想 关闭 这 些 详细 信息 的 显示 ,可 以 
把 Spark 安装 文件 夹 的 conf 文件 夹 中 log4j. properties. template 文件 复制 一 份 保 存 到 conf 
文件 夹 中 并 改名 为 log4j. properties ,然后 使 用 记事 本 打开 新 文件 ,把 里 面 的 INFO 都 改 为 
WARN ,关闭 后 重启 pyspark. cmd 就 可 以 了 ,这 个 操作 和 设置 对 使 用 spark-submit. cmd 提 
交 并 执行 的 程序 也 同样 有 效 。 


12.6 ”GPU 编程 


自 计算 机 诞生 以 来 ,都 是 由 CPU 承担 着 数据 的 计算 和 处 理 任务 ,著名 的 NVIDIA 厂商 
于 2007 年 做 了 一 次 大 胆 的 尝试 ,使 用 GPU 中 功能 简单 而 数量 众多 的 处 理 模块 来 配合 
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CPU 实现 并 行 处 理 , 从 而 实现 大 幅度 加 速 。 这 一 尝试 获得 了 巨大 成 功 ,并 被 迅速 应 用 到 
数据 挖掘 与 分 析 、 并 行 处 理 、 机 器 学 习 、 科 学 计算 等 行业 和 领域 。 

CPU 由 专 为 串 行 处 理 而 优化 的 几 个 核心 组 成 。GPU 由 数量 众多 的 更 小 、 更 高 效 的 核 
心 组 成 ,这 些 核心 专 为 同时 处 理 多 任务 而 设计 ,虽然 每 个 核心 的 功能 并 不 像 CPU 那么 强 
大 ,但 是 用 来 并 行 处 理 一 些小 任务 ,还 是 具有 很 大 优势 的 。 

实现 GPU 运算 首先 需要 显卡 (例如 NVIDIA 显卡 ) 的 支持 ,并 且 根 据 需 要 安装 相应 的 
Python 扩展 库 , 例如 pycuda、pyopencl、theano、 scikit-learn、NumbaPro、TensorFlow。 不 过 ， 
GPU 加 速 也 不 是 万 能 的 ,并 不 是 适用 于 所 有 场合 的 应 用 ,如 果 需 要 在 CPU 和 CPU 之 间 频 
繁 传输 数据 ,反而 会 影响 效率 ,不 如 直接 使 用 CPU 的 速度 快 。 


1261 使 用 pycuda 实现 GPU 加 速 


借助 于 扩展 库 pycuda, 可 以 在 Python 中 访问 NVIDIA 显卡 提供 的 CUDA 并 行 计算 
API, 使 用 非常 方便 。 安 装 pycuda 时 要 求 已 正确 安装 合适 版 本 的 CUDA 和 Visual Studio 
(注意 ,并 不 是 版 本 越 新 越 合 适 ) ,然后 再 使 用 pip 安装 pycuda。 下 面 的 案例 使 用 pycuda 
在 GPU 上 并 行 判断 素数 ,测试 结果 显示 在 640 核 GPU 上 的 运行 速度 为 4 核 CPU 的 8 倍 
左右 。 

示例 12-31 使 用 pycuda 在 GPU 上 并 行 判断 素数 ,统计 100 000 000 之 内 的 素数 
个 数 。 

jimport time 

inport PYcuca .autoinit 

jnmport PYcucB.driver as drv 

inport mnpy as rp 

fram pycuca .orpiler inport SoroMoule 











策 译 < 代码 进入 显卡 ,并 行 判断 素数 
mod=scourcsMbaae(' 
__glcbal_ _ woid isprime (int xcest, int sevjint 4) 
{ 
const int i threadIdx.x tblockDim.x* blockIdx.x; 
int j; 
for(j 2;j <b[i];j+H) 
{ 
if(a[i]sj==0) 
. 
Lreak; 
3 
人 
证 9 >=P[i]) 
{ 
Gest[i] eril; 
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} 
} 


0) 


证 义 待 测 数值 范围 ,以 及 每 次 处 理 的 数字 数量 
end 00000000 
size 4000 


和 催 取 函 数 
isPrime od.get_ finctian ("isPrime") 
result =0 


Start time.time() 
份 段 处 理 , 每 次 处 理 1000 个 数字 
for i in range (end//size): 
StartN =i *size 
a =p.array (range (startN, startN +size) ) .astype (rp.int64) 
也 中 是 a 中 对 应 数字 的 平方 根 加 1 后 的 整数 ,用 于 快速 判断 素数 
b=p.array (list ep (lanbda x: int (x**0.5) 1,a))) .astype (rp.inte4) 
GEst =p.zercs like(a) 
isPrime (drv.Out (dest) ,drv. mn (a) ,drv.m bo), 
hlock=(size,1,1),grid=@,1)) 
result +=len(set (filter NenevGest))) 
Print (time.time () -start) 


幅面 的 代码 中 把 工 也 算 上 了 ,这 里 减 去 
Print (result 1) 


1262 使 用 pyopand 实现 GPU 加 速 


扩展 库 pyopencl 使 得 可 以 在 Python 中 调用 OpenCL 的 并 行 计算 API。OpenCL( Open 
Computing Language ) 是 跨 平台 的 并 行 编程 标准 ,可 以 运行 在 个 人 计算 机 、 服 务 器 移动 终 
端 以 及 钥 入 式 系 统 等 多 种 平台 , 既 可 以 运行 在 CPU 上 又 可 以 运行 于 GPU 上 ,大 幅度 提高 
了 各 类 应 用 中 的 数据 处 理 速度 ,包括 游戏 .娱乐 .医学 软件 以 及 科学 计算 等 。 下 面 的 案例 
使 用 pyopencl 在 CPU 上 并 行 判断 素数 ,测试 结果 显示 在 640 核 CPU 上 的 运行 速度 为 4 核 
CPU 的 12 倍 左右 。 

示例 12-32 使 用 pyopencl 在 GPU 上 并 行 判 断 素 数 , 统 计 100 000 000 之 内 的 素数 
个 数 。 

jimport mnpy as rp 

jmport Pycpencl as cl 

inport PYopencl .array 
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制 断 素数 的 c 语 言 版 so 代码 
isPrime 二 lerentwissgernel (ctx, 
"eng 得 gong 和 g,1org es g', 
int j; 
ford 2;j<b glil; 了 + 二 
. 
if(a g[li]$%j==0) 
和 . 
break; 
} 
} 
if > g[i]) 
{ 
res g[li] a g[il; 
| lt 
"isPrime' 
) 


证 义 待 测 数值 范围 ,以 及 每 次 处 理 的 数字 数量 
end 所 00000000 

Start_ end=range C,end) 

size 4000 


resut -0 


ctx=cl.create sare ontext() 
ere = 一 1.Comancpoeue (ch) 


峙 指定 范围 内 的 数字 进行 分 批 处 理 
for i in range (end//size 1): 
StartN =i *size 
硒 次 要 处 理 的 数字 范围 
a_rPp=p.array (start_end[startN: startN +size]) .astype (rp.int64) 
知 mp 里 的 数字 是 a mp 中 数字 的 平方 根 取 整 后 加 1 
b rpP=p.array (list (ep (larbbda x: int (x*30.5) +11,a_ rp))) .astype (rp.inte4) 
把 数据 写 人 GE 
a g=c.array.to deice (Goeoe,a np) 
b g=cl.array.to device (queve,p np) 
Tes_g=cl.array.zeros like(a g) 
杂 量 判断 
isPrime(a grb grres g) 
t=set (Filter Neonevres g-get 0)) 
所 录 本 批 数字 中 素数 的 个 数 
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result +=len(t) 
Print (result) 
1263 使 用 tensorflow 实 现 GPU 加 速 


tensorflow 是 一 个 用 于 人 工 智能 的 开源 神器 ,是 一 个 采用 数据 流 图 ( data flow graphs) 
用 于 数值 计算 的 开源 软件 库 。 数 据 流 图 使 用 节点 (nodes) 和 边线 (edges) 的 有 向 图 来 描述 
数学 计算 ,图 中 的 节点 表示 数学 操作 ,也 可 以 表示 数据 输入 的 起 点 或 者 数据 输出 的 终点 ， 
而 边线 表示 在 节点 之 间 的 输入 输出 关系 ,用 来 运输 大 小 可 动态 调整 的 多 维 数据 数组 ,也 就 
是 张 量 (tensor) 。tensorflow 可 以 在 普通 计算 机 、 服 务 器 和 移动 设备 的 CPU 和 GPU 上 展开 
计算 ,具有 很 强 的 可 移植 性 ,并 且 支 持 C ++ Python 等 多 种 语言 。 

示例 12-33 ”使 用 tensorflow 中 的 梯度 下 降 算法 求解 变量 最 优 值 。 


inport tensorflow as tf 
inmport mmpy as Pp 
inport time 


重用 NurEy 生成 随机 数据 ,总 共 2 行 100 列 个 点 

x cata =Pp. 旦 cat32 (rp.randam.rand (2,200)) 

和 矩 阵 乘法 

伏 里 的 w=[0.100,0.200] 和 b-0.300 是 理论 数据 ,通过 后 面 的 训练 来 验证 
Y cata =p.dot ([0.100,0.200] ,x Gata) +0.300 


构造 一 个 线性 模型 ,训练 求解 mw 和 

制 始 值 p=[0.0] 

btf.Variable (tf.zeros ([1])) 

制 始 值 w 为 1x2 的 矩阵 ,元 素 值 介 于 [也 -0/1.0] 区 间 
Wtf.Variable (tf.random nifom([1,2], 71.0,1.0)) 
构建 训练 模型 ,matrul 为 矩阵 乘法 运算 
ytf.nmatml Wx data) tp 


万 小 均 方差 
]oss 十 f.Tecuce mean(tf.sqarely -y cata)) 


制 始 化 变量 
init tf.gldoal variables initializer() 


with tf.device (gpa:00 : 
with tf-Sessicn () as sess: 
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制 始 化 


ssess.run (init) 


叔 合 平面 ,训练 次 数 越 多 越 精确 ,但 是 也 没有 必要 训练 太 多 次 
for step in range (0,201) : 
sess.run (train) 
声 示 训练 过 程 ,这 里 演示 了 两 种 查看 变量 值 的 方法 
print (step, sess.rn (W) ,b.eval 0) 
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关于 Socket 编程 的 内 容 ,在 作者 的 另 一 本 书 《Python 可 以 这 样 学 》 (清华 大 学 出 版 社 ， 
书号 为 9787302456469 ) 里 介绍 了 很 多 ,为 了 避免 重复 ,已 经 介绍 过 的 基础 知识 和 案例 就 
不 在 本 书 出 现 了 ,本 书 把 重点 放 在 标准 库 asyncio 提供 的 网 络 通信 功能 上 。 另 外 ,在 第 12 
章 介 绍 多 进程 编程 的 案例 时 也 涉及 了 网 络 通信 功能 ,请 自行 翻阅 。 


13.1 Transport 类 与 Protocol 类 


标准 库 asyncio 提供 的 BaseTransport ,ReadTransport 、WriteTransport .DatagramTransport 以 及 
BaseSubprocessTransport 类 对 不 同类 型 的 信道 进行 了 抽象 。 一 般 来 说 不 要 使 用 这 些 类 去 直 
接 实例 化 对 象 ,而 是 应 该 调用 AbstractEventLoop 函数 来 创建 相应 的 Transport 对 象 并 且 对 底 
层 信 道 进 行 初始 化 。 一 旦 信道 创建 成 功 ,就 可 以 通过 一 对 Protocol 对 象 进行 通信 了 。 目 前 
asyncio 支持 TCP .UDP .SSL 和 Subprocess 管道 ,不 同类 型 的 Transport 对 象 支持 的 方法 略 有 
不 同 。 另 外 需要 注意 的 是 ,Transport 类 不 是 线程 安全 的 。 

标准 库 asyncio 还 提供 了 类 Protocol .DatagramProtocol 和 SubprocessProtocol ,这 些 类 可 
用 作 基 类 进行 二 次 开发 来 实现 自己 的 网 络 协议 ,创建 派生 类 时 只 需 重 写 感 兴趣 的 回调 本 
数 即 可 , 详 见 表 13-1。Protocol 类 常 与 Transport 类 一 起 使 用 ,Protocol 对 象 解析 收 到 的 数据 
并 请 求 待 发 出 数据 的 写 操作 ,而 Transport 对 象 则 负责 实际 的 IO 操作 和 必要 的 缓冲 。 

表 13-1 Protocol 对 象 常用 回调 函数 








函数 名 称 说 明 适用 对 象 
connection_made(transport) 连接 建立 后 自动 调用 Protocol Datagram- 
Protocol 
connection_lost( exc) 连接 丢失 或 关闭 后 自动 调用 ell 





子 进程 往 stdout 或 stderr 管道 中 写 入 数据 时 
pipe_data_received( fd, data) 自动 调用 ,fd 是 管道 的 标识 符 ,data 是 要 写 入 
的 非 空 字 节 串 


pipe_connection_lost(fd，exc) ”| 与 子 进程 通信 的 管道 被 关闭 时 自动 调用 
process_exited( ) 子 进程 退 出 后 自动 调用 


SubProcessProtocol 
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续 表 
函数 名 称 说 明 适用 对 象 
data_received( data) 收 到 数据 ( 字 节 串 ) 时 自动 调用 
通信 对 方 通过 write_eof( ) 或 其 他 类 似 方法 通 | Protocol 


eof_received( ) 知 不 再 发 送 数据 时 自动 调用 


datagram_received( data, addr) | 收 到 数据 报时 自动 调用 
前 一 次 发 送 或 接收 操作 抛 出 异常 OSError 时 | DatagramProtocol 








error_received( exc) 














自动 调用 
sa Transport 对 象 缓冲 区 达到 上 水 位 线 时 自动 
Pause_writing( ) 调用 Protocol 
i 二 一 | DatagramProtocol 
Se ee 对 象 缓 冲 区 达到 下 水 位 线 时 自动 | SubprocessProtocol 


可 以 在 Protocol 对 象 的 方法 中 使 用 ensure_future( ) 来 启动 协 程 ,但 并 不 保证 严格 的 执 
行 顺序 ,Protocol 对 象 并 不 清楚 在 对 象 方法 中 创建 的 协 程 ,所 以 也 不 会 等 待 其 执行 结束 。 
如 果 需 要 确定 执行 顺序 的 话 , 可 以 在 协 程 中 通过 yield from 语句 来 使 用 Stream 对 象 。 

示例 13-1 使 用 TCP 进行 通信 。 

(1) 服务 端 代码 。 


jnmport asyncio 


Class EchoServerClientProtoool (asyncio.Probtoccl) : 
姓 接 建立 成 功 
GEf connecticn rece (self, transport) : 
Peemare =transport.get_extra info('peemame') 
Print (‘Canectian from {} .fonrat (peemame)) 
Self.transport =transport 


散 到 数据 
def data_ received (self, data) : 
message =cata.decode () 
Print ('Data received: {!r}' .fmet (ressage)) 


Print ('send: {!r}' .fomat (message)) 
Self.transport .write (Gata) 


寻 方 发 送 消息 结束 

Gef eof received(salf) : 
Print ('Close the client socdet') 
Self.transport.close () 


lccp asyncio.get event lop() 
莉 | 建 服务 器 ,每 个 客户 端的 连接 请 求 都 会 创建 一 个 新 的 Protccol 实例 
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Coro Aop.create server (EchoServerClientProtoool, "127.0.0.1',8888) 
server op.rn until _ complete (coro) 


役 务 器 一 直 运行 ,直到 用 户 按 下 ctrl +C 键 
Print ('Serving cn {} .fomat (server.sockets[0] -getsocmere 0)) 
try: 
Joecp.run forever() 
except Feyboardmterrupt: 
Fass 





媒 闭 服务 器 

server.close () 

lop.rm until complete (server.wait closed()) 
locp.close() 


(2) 客户 端 代码 。 


jimport asyncio 
inport time 


Class EchoclientProtocpl (asyncio.Protocol) : 
Gf __init _ (self,messaoe,1loop) : 
Self .message -essacP 
Self.lop “lop 


姓 接 创建 成 功 
GEf connecticn mece (self, transport): 
fer m in mressacP: 
transport .write tm.enoode ()) 
Print ('Data sent: {!r}'.fomrat m) 
time.slesp (1) 
丛 部 消息 发 送 完成 ,通知 对 方 不 再 发 送 消息 
transport .write eof() 


散 到 数据 
CEf cata received (self,data): 
Print ('Data received: {!r}".fomat (Gata.decode())) 


姓 接 被 关闭 

GEf connecticn lost (selfvexc) : 
Print ("The server closed the connection) 
Print ('stop the event lop') 
Self.lop.stop0) 


lop asyncio.get event loop0 
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message =["'"Hello worlg!', "你 好 "] 

oro Aop.create connecticn (arbda: EchoclientProbocol fmessage, 10p), 
"127.0.0.1"',8888) 

lop.nn until onplete (coro) 

lop.rn forever() 

locp.close() 


示例 13-2 使 用 UDP 进行 通信 ,模拟 时 间 服 务 器 ,服务 端 可 以 接收 客户 端的 定期 查 
询 并 返回 当前 时 间 。 

(1) 监听 端 代码 。 

inport asyncio 

jimport aatetime 

jimport socket 


Class EchoServerProtocol: 
GEf connecticn mece (self, transport): 
self.transport =transport 


GEf datagram received (self, data,acdr) : 
message =cata .decode () 
Print ('Received from', str (actir)) 
now =str (Gatetime.datetime.now()) [:19] 
Self .transport .sendto (now.enoode () ,aceir) 
Print ('replied') 


lop easyncio.get event lop() 

Print ("starting UDP server") 

雁 取 本 机 下 地 址 

ip =socket .gethostioyname (socket.gethostname () ) 

基建 Protocol 实例 ,服务 所 有 客户 端 

listen =loqp.create datagram endpoint (EhoServerProtoool, 
local_actir =(ip, 9999)) 

transport,Protcccl Alop.rn until omplete (listen) 


transport..close() 
lccp-clcse0 


(2) 客户 端 代码 。 


368 | Python 程序 设计 开发 宝典 





inport asyncio 
import tire 


Class EchoclientProtocol : 
def__init (selfrmessageyloap) : 
self.messace -messacP 
self.10p op 


GEf connecticn mece (self, transport): 
self.transport transport 
Self .transport .sendto (self.messacP.encocGe ()) 


GEf catagram received (self, data, acddr) : 
Print ("Now is:",data.decode ()) 
Self.transport .close () 


Cef error received (self,exr) : 
Print ('Error reoeived: ',exrc) 


GEf connecticn lost (selfvexc) : 
self.loop.stop() 


loqp asyncio.get event loop () 
message ="ask for time" 
while True: 
mect Aop.create datagram endpoint ( 
lanbda: EchocclientProbocol (ressage, 
lomp) ,remote adtir =("10.2.1.2',9999)) 
transport, protoool =lop.rn until complete (omnect) 
lop.nm forever() 
transport.close () 
time.slesp (1) 
locp.close() 


示例 13-3 ”注册 用 于 接收 数据 的 Socket ,并 实现 两 个 Socket 之 间 的 数据 传输 。 
jimport asyncio 
try: 
fram socket irport socketpair 
except IrportError: 
fram asyncio.windows_utils import socketpair 


class MYProtocol (asyncio.Protocol) : 
def connecticn mece (self, transport) : 
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Self.transport transport 


GEf cata received (self, data) : 
接收 数据 ,关闭 Transport 对 象 
Print ("Received:",data.decode ()) 
self.transport.close () 


GEf connecticn lost (self, eer) : 
ockst 已 被 关闭 ,停止 事件 循环 
lop.stop0) 


区 | 建 一 对 互相 连通 的 socket 
ITScckrwsock=socketpair () 
ccp =esyncio.get_ewvernt_ loop() 


娃 册 用 来 等 待 接收 数据 的 socket 
connect_coro 导 oop.create _ connecticn MyProtoool, sock =rsock) 
transport,Protocol =lop.rn Wntil omplete (connect coro) 


竹 互 相连 通 的 sockest 中 的 一 个 写 人 数据 
lop.call_ so (wsock.sena 'hello wmaqd.'.encoce ()) 


坊 动 事件 循环 
lop.rmn forever() 


rsock.close() 
wsock.close() 
locp.close() 


13.2 StreamReader 与 StreamWriter 


asyncio 模块 还 提供 了 open_connection( ) 函数 (对 AbstractEventLoop. create_connection 
() 函数 的 封装 )、open_unix_connection ( ) 函数 (对 AbstractEventLoop. create _unix _ 
connection ( ) 函数 的 封装 ) 以 及 start _ server ( ) (对 AbstractEventLoop. create _ 
server( ) 函数 的 封装 ) 和 start_unix_server( ) 函数 ,这 些 都 是 协 程 函数 ,其 中 的 参数 含义 与 
被 封装 的 函数 基本 一 致 。 

open_ connection ( ) 函数 执行 成 功 的 话 会 返回 (reader, writer), 其 中 reader 是 
StreamReader 类 的 实例 ,而 writer 是 StreamWriter 类 的 实例 。StreamReader 类 提供 了 set_ 
transport( transport) ,feed_data( data) 和 feed_eof( ) 方 法 以 及 协 程 方法 read(n = -1)、 
readline( ) \readexactly(n) .readuntil( separator = b"\n') 用 来 从 Transport 对 象 中 读 取 数据 ; 
封装 了 Transport 类 的 StreamWriter 类 则 提供 了 普通 方法 close( ) .get_extra_info( ) .write 
(data) ,writelines( data) .write_eof( ) 和 协 程 方法 drain( ) (如 果 Transport 对 象 的 缓冲 区 达 


370 [4 Python 程序 设计 开发 宝典 





. 


到 上 水 位 线 就 会 阻塞 写 操 作 ,直到 缓冲 区 大 小 被 拉 到 下 水 位 线 时 再 恢复 ) 。 
示例 13-4 使 用 StreamReader 和 StreamWriter 实现 网 络 聊天 程序 。 
(1) 服务 端 代码 。 


jimport asyncio 


messages ={'Hello': nihao', 
"HEw are you?' : 'Fine, thank you.', 
"Did you have breakfast?' :Yes 
"Bye': 'Bye'} 
@ asyncio.coroutine 
GEf handle echo (reader, writer) : 
while True: 
aata =yield from reader.read (100) 
message =cata.decode () 
actir writer.get extra info('peemere') 
Print ("Received $r fram %r" % (message,addir)) 


TESsageReply essages .get (message, 'Sorry') 
Print ("Send: $r" SmessageReply) 
writer .write (messageReply.encode ()) 
Yield from writer.drain() 
if messageReply =="'Bye': 
break 


Print ("Close the client socket") 
writer.clcee () 


创建 事 件 循环 

locp =asyncio.get event loop() 

区 | 建 并 启动 服务 器 

coro -asyncio.start_server (handle echp, '10.2.1.2',8888, 100p Sop) 
server <lop.rn until omplete (coro) 


Print ('Serving cn {}"' .fomrat (server.sockets [0] .getsocmame ())) 
下 ctrl +C 键 或 ctrl tereak 键 退出 
try: 
oop.run_ forever() 
Except Feyboardmternpt: 
Fess 


寿 闭 服务 器 
server.close() 
loop.run until onplete (server.wait closed()) 
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locp.close() 
(2) 客户 端 代码 。 
jimport asyncio 


@ asyncio.corcutine 
Gef tap echo_ client (op): 
reader, writer =yield from asyncio.qpen onectin('10.2.1.2', 
8888, 10p 3100p) 


while True: 
message =irput ('You said:') 
writer.write (message.encode ()) 
data yield from reader.read (01.00) 
Print (Received: sr' $data.decode ()) 
if message Bye': 
break 


Print ('Close the socket') 
writer.close () 


loqp esyncio.get event lop() 
lop.nm wntil omplete (tqp echp_ client (loop)) 
lccp.clcse (0) 


示例 13-5 使 用 StreamReader 和 StreamWriter 获取 网 页 头 部 信息 。 


jnmport asyncio 
inport urllib.parse 
inport sys 


@ asyncio.coroutine 
cef print http heacers (url) : 
Url urllib.parse.urlsplit (url) 
if url.schere =="'https': 
connect 一 syncio.apen_ccnnecticn (url .hostname, 443, ssl =True) 
else: 
connect asyncio.qpen_ ccnnecticn (url .hostname,80) 
Teacer,writer =yield from connect 
ery =("HEAD {path} HITP/1 .0 \nEPSt: fbhostneamel Nm 
) .fomrat (Path =ur] .path or '/',hostname =url .hostnare) 


writer.write (query.encode ("latin 1")) 


while True: 
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line ~yield from reader.readline () 
if not line: 

break 
Jine 导 ine.decode('atinl') .rstrip() 
if line: 

Print ('HITP heacer >% s' $line) 


writer.close () 


Url ="'https://cdocs.pythan.org/3/library/asyncio -streem-html" 
loop asyncio.get event. loop() 

task asyncio.ensure _ future (print http heecers (url)) 
lop.rm until complete (task) 

locp.close() 


示例 13-6 注册 端口 并 接收 数据 。 
inport asyncio 


try: 
fram socket irport socketpair 
except IrportError: 
fram asyncio.windows utils import socketpair 


@ asyncio.coroutine 

Gef wait for cdata (locp) : 
创建 一 对 互相 连通 的 socket 
rsock, wsock =socketpair () 


娃 册 用 来 接收 数据 的 scckst 
reader, writer =yield fram asyncio.aqpen_ ccnnecticn (sock =rsock, lcop 导 cop) 


师 过 socket 写 和 人 数据 
lop.call_ som (wsock.send, "This is a test.'.encode (0)) 


往 待 接收 数据 
cata =yield fran reacer.read (100) 
Print ("Received:", data.decode ()) 


writer.close() 
wsock.close () 


op asyncio.get event lop() 
lop-rn until _ complete wait for Gata(locp)) 
lccp-clcse0 
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附录 A GUI 开发 


目前 适用 于 Python 的 GUI 库 主 要 有 wxPython ,tkinter 和 PyQT, 其 中 


wxPython 似乎 更 


强大 一 些 , 不 过 需要 额外 安装 才 行 ,虽然 这 并 不 麻烦 。 而 tkinter 是 Python 标准 库 , 可 以 直 
接 使 用 ,也 具有 很 大 的 优势 。 关 于 wxPython 的 更 多 介绍 请 参考 我 的 另外 一 本 书 《Python 
程序 设计 (第 2 版 )》( 清 华 大 学 出 版 社 ,书号 为 9787302436515 ) ,tkinter 的 大 量 案 例 代 码 
可 以 参考 我 的 另外 一 本 书 《Python 可 以 这 样 学 》( 清 华 大 学 出 版 社 , 书号 为 
9787302456469 ) 。 这 里 再 通过 一 个 GUI 版 的 猜 数 游戏 介绍 一 下 tkinter 的 高 级 用 法 。 


把 下 面 的 代码 保存 并 运行 之 后 ,首先 需要 启动 游戏 并 设置 数值 范围 
次 数 ,然后 才能 在 文本 框 内 输入 猜测 的 数字 ,程序 会 提 





和 最 大 允许 猪 数 


示 正 确 .数值 过 大 或 过 小 ,玩家 根据 提示 对 下 一 次 猜 数 me、 一 一 
进行 调整 ,超过 次 数 限制 之 后 游戏 结束 并 提示 正确 的 er 


数字 ,退出 程序 时 提示 战绩 。 游 戏 运行 初始 界面 如 附 


图 A. 1 所 示 。 图 A.1 和 猜 数 游戏 运行 初始 界面 


IToct tkinter.Tk() 

简 口 标题 
roct.title(' 猜 数 游戏 一 一 by 董 付 国 ') 
简 口 初始 大 小 和 位 置 

roct .geametry ('280x80 +400 +300') 

环 允 许 改变 窗口 大 小 

root .resizable (False, False) 


骨 户 猜 的 数 

varNamnber -tkinter.Stringvar (root,value ="0") 
柄 许 猜 的 总 次 数 

totalTimes =tkinter. IntVar (root,value -0) 
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志和 猜 次 数 

alreary tkinter. mtVar (root,value =0) 

站 前 生成 的 随机 数 
CurrentNnber tkinter. ntVar (roct,value -0) 
妖 家 玩 游戏 的 总 次 数 

times tkinter. IntVar (root,value =-0) 

壬 家 猜 对 的 总 次 数 

right =tkinter. mtVar (root, value =0) 


lp tkinter.Iabel (root,text =' 请 输入 一 个 整数 : ) 

Jp.Place (X30,y 30,width 400, height =20) 

由 户 猜 数 并 输入 的 文本 框 

EntryNnber tkinter.Entry (root,width 4140, textvariable 一 arNuniber) 
entryNnber .place (x 110,y 310,width 440, height =20) 

可 有 开始 游戏 以 后 才 允 许 输 入 

entryNnber['state'] ="'dissbled' 


媒 闭 程序 时 提示 战绩 

GEf closeWindow() : 
message =' 共 玩 游戏 {0} 次 , 猜 对 f} 次 ! vn 欢迎 下 次 青 玩 ! ' 
message ressage. forrat (times .get () , right .gat ()) 
tkinter.messagebax.showinfo (" 战 绩 ',message) 
root .destroy () 

Toot.Protocol ("WM CETETE, WINDOW', closeWincow) 


婉 钮 单 击 事件 处 理 函 数 
def buttonclick() : 
if buttcn['text'"] =="'Start Game': 
每 次 游戏 时 允许 用 户 自 定义 数值 范围 
桥 家 必须 输入 正确 的 数 
while True: 
try: 
start tkinter.simpledialog.askinteger(' 允 许 的 最 小 整数 '， 
"最 小 数 ,initialvalne 司 ) 
break 
eoept: 
Fass 
while True: 
try: 
end tkinter.sinpledialog.askinteger(' 允 许 的 最 大 整数 '， 
' 最 大 数 ',initialvalue 0) 
break 
except: 
Fass 
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柱 用 户 自 定义 的 数值 范围 内 生成 随机 数 
CurrentN nber.set (randam.randint (start,end)) 
硝 户 自 定义 一 共 允 许 猜 几 次 
杜 家 必须 输入 正确 的 整数 
while True: 
try: 
t=tkinter.sinpledialog.askinteger ("最 多 允许 猜 几 次 ?'， 
' 总 次 数 ',initialvalye 3) 
totalTimes.set (t) 
break 
exoept: 
Fess 
刀 猿 次 数 初始 化 为 0 
already.set (0) 
buttoan['text"] = 剩余 次 数 : ' +str(t) 
由 文本 框 初始 化 为 0 
VerNmiber.set("07) 
枕 许 用 户 开 始 输入 整数 
entryNnber ["state"] ='normmel' 
是 游戏 的 次 数 加 1 工 
times.set (times.get () 1) 
else: 
#- 共 允许 猿 几 次 
total totalTimes .gat () 
体 次 游戏 的 正确 答案 
current =cCurrentNuriper.get () 
是 家 本 次 猜 的 数 
try: 
Xx=int (varNnber .gat ()) 
exoept: 
tcinter.messagsbcx.showerror(' 抱 歉 ', "必须 输入 整数 ') 
retum 
if x==Orrent: 
tkinter.messagsbcx.showinfo(' 菩 喜 ', ' 猜 对 了 ') 
bttan['text'] ="'Start Game' 
瞪 用 文本 框 
entryNnber['state'] ='disabled' 
right.set (right .get () 1) 
else: 
志和 猪 次 数 加 1 
already.set (already.get () 1) 
if x>arrent: 
tkinter.messagsbcox.showerror(" 抱 菊 ', ' 猜 的 数 太 大 了 ') 
else: 
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tkinter messagebcx.showerror(" 抱 区 …， ' 猜 的 数 太 小 了 ') 
条 猜 次 数 用 完了 
if already.get () ==total: 
tkinter .messagsbcxz.showerror(' 抱 菊 '， 
"游戏 结束 了 ,正确 的 数 是 : ' + 
str (currentNmiber.getO)) 
buttan[ "text'] ="Start Gamey 
再 用 文本 框 
entryNrber['state'] ='disabled' 
else: 
button["text'] = 剩余 次 数 : ' +str (total -alreacy.gat (0)) 
症 窗口 上 创建 按钮 ,并 设置 事件 处 理 函 数 
buttcn -tkinter.Buttbcn (root, text ="Start Game', oqmend <puttonclick) 
utton.place (x 40,y =40,width =250, height =20) 


妨 动 消息 主 循环 
roct .mainloop() 

上 面 的 小 游戏 是 使 用 代码 生成 的 tkinter 界面 ,这 样 做 对 只 有 少量 组 件 的 界面 是 没有 
问题 的 ,但 是 如 果 界 面 上 需要 放置 大 量 的 组 件 , 这 样 手动 创建 就 比较 费时 费力 了 ,可 以 考 
虑 使 用 PAGE 来 实现 复杂 的 界面 设计 。 

安装 好 并 启动 PAGE 之 后 ,首先 创建 一 个 Toplevel, 然 后 在 左 侧 Widget Toolbar 中 选择 
需要 创建 的 组 件 , 在 刚刚 创建 的 Toplevel 中 合适 位 置 单 击 即 可 创建 组 件 ,将 其 拖 放 至 合适 
的 位 置 ,最 后 在 右 侧 的 Attribute Editor 设置 组 件 的 属性 和 有 关 的 操作 。 界 面 设计 好 以 后 ， 
单 击 菜单 Gen _Python 中 的 子 菜单 Generate Python GUI 生成 界面 程序 ,再 使 用 菜单 
Generate Support Module 生成 Python 程序 文件 ,填写 必要 的 命令 处 理 ( 如 单 击 按钮 ) 代码 
后 保存 即 可 。 


附录 B SQLite 数据 库 操作 


SQLite 是 内 艇 在 Python 中 的 轻 量 级 、 基 于 磁盘 文件 的 数据 库 管理 系统 ,不 需要 安装 
和 配置 服务 器 ,支持 使 用 SQL 语句 来 访问 数据 库 。 该 数据 库 使 用 C 语言 开发 ,支持 大 多 
数 SQL91 标准 ,支持 原子 的 一致 的 、 独 立 的 和 持久 的 事务 ,不 支持 外 键 限制 ;通过 数据 库 
级 的 独占 性 和 共享 锁定 来 实现 独立 事务 , 当 多 个 线程 同时 访问 同一 个 数据 库 并 试图 写 入 
数据 时 ,每 一 时 刻 只 有 一 个 线程 可 以 写 和 人 数据。 

SQLite 支持 最 大 140TB 大 小 的 单个 数据 库 , 每 个 数据 库 完全 存储 在 单个 磁盘 文件 
中 ,以 B+* 树 数据 结构 的 形式 存储 ,一 个 数据 库 就 是 一 个 文件 ,通过 直接 复制 数据 库 文件 就 
可 以 实现 备份 。 使 用 SQLite 数据 库 并 不 需要 专门 启动 什么 服务 ,也 没有 开放 访问 端口 ， 
这 意味 着 不 能 访问 其 他 机 器 上 的 SQLite 数据 库 , 很 难 把 程序 服务 器 和 数据 库 服 务 器 分 
离 ,当然 可 以 自己 编写 相应 的 通信 程序 来 解决 这 个 问题 。 如 果 需 要 使 用 可 视 化 管理 工具 ， 
可 以 使 用 SQLiteManager .SQLite Database Browser 或 其 他 类 似 工具 。 
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Python 标准 库 sqlite3 提供 了 SQLite 数据 库 访问 接口 ,连接 数据 库 之 后 剩 下 的 工作 就 
是 使 用 SQL 语句 对 数据 进行 增 、 删 、 改 、 查 了 。 能 够 阅读 本 书 的 读者 相 比 已 经 有 了 一 些 
SQL 语句 的 编写 经 验 , 就 不 再 过 多 介绍 相关 语法 了 。 下 面 的 代码 简单 演示 了 sqlite3 模块 
的 用 法 。 

>>>import sqlite3 


>>>comn =sqlite3.connect ('test .do') 府 接 或 创建 数据 库 

>>>cur =comn.cursor 0 利 建 游标 

>>>cur.execute ('CREATE TAEIE tableTest (fFieldl nmeric, field? text) ') 
利 建 数据 表 


<sqlite3.Cursor abject at 0x000001CTAB3B43E0 > 
>>>Gata =zip (range (5), 'abode') 
>>>Ccur.exEcutereny ('INSEFT INID tableTest values (?,?) ',data) 

炳 入 多 条 记录 
<sqLite3.Cursor abject at 0xD00001C7RE3B43B0 > 
>>>Cur.exEcute ('SETECT FOM tableTest CROER BY fieldl TESC') 

得 询 记录 
<sqlite3.Cursor abject at 0xD00001C7RE3B43B0 > 
>>>for rec in cur.fEtchall (): 

Print (rec) 
(4,'e') 
(3,'d') 
QC"'c') 
(1,'b') 
(0,'a') 


附录 C 计算 机 图 形 学 编程 


计算 机 图 形 学 主要 研究 如 何 使 用 计算 机 来 生成 具有 真实 感 的 图 形 ,涉及 的 内 容 主要 
包括 三 维 建 模 图形 几 何 变换 .光照 模型 .纹理 映射 .阴影 模型 等 内 容 ,在 机 械 制 造 .虚拟 现 
实 .增强 现实 ,游戏 开发 .漫游 系统 设计 .产品 展示 等 多 个 领域 具有 重要 的 应 用 。 随 着 3D 
打印 机 的 诞生 ,只 要 有 模型 就 能 够 快速 生成 实物 ,无 疑 这 将 会 大 大 扩展 计算 机 图 形 学 的 应 
用 范围 ,例如 ,可 以 使 用 计算 机 图 形 学 的 技术 制作 出 各 种 可 爱 的 模型 ,然后 参照 这 些 模型 
使 用 3D 打印 机 批量 生产 各 种 食品 .玩偶 饰品 和 人 体 器 官 等 。 目 前 大 部 分 计算 机 图 形 学 
的 书籍 都 是 基于 OpenGL 的 ,Python 也 提供 了 相应 的 扩展 库 pyopengl, 提供 了 图 形 学 编程 
所 需要 的 所 有 API 函数 , 极 大 方便 了 编写 图 形 学 程序 的 Python 程序 员 。 下 面 的 代码 使 用 
OpenGL 绘制 了 一 个 茶壶 ,实现 了 基本 的 材质 和 光照 模型 ,并 支持 缩放 和 绕 不 同 坐标 轴 的 
旋转 操作 。 

inport sys 

fram GpenGD.GL inport * 
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fram OpenGL-GLDT inport * 
fram OpenGL-GLD import * 


Class MyPYOPenGTTEest: 
df _init _(self,widih=640,height =480,title =p'solidreapot'): 

Gut nit (sys.argy) 
glut mitDisplay Mde (GIOT FEEA | GLDT DoOBIE | GLDT TEPTH) 
Gt mitWwindowSize (width, height) 
Self.window =glutCreateWindow (title) 
lutDisplayFunc (self .Draw) 
目 定 键盘 事件 处 理 函数 
GutFeyboardFunc (self .FeyPress) 
gutIaegunc (self .Draw) 
self.InitGr (width, heignht) 
艇 各 坐标 轴 旋 转 的 角度 
Self.x=0.0 
self.y=0.0 
self.z-0.0 
稀 放 比例 
self.s 酉 .0 


GEf FeyPress (self, key,x,y) : 
根据 不 同 的 按键 决定 缩放 比例 和 每 个 轴 的 旋转 角度 
j key=='a': 
Self.x + 本 
elif ky==b's': 
Self.x 一 丑 
elif ky==p"j": 
self.y + 
elif Jey==b'k': 





glClear (Gh ACR BUFFER BIT | GL DEPTH BUFFFR BIT) 
lioadrdentity() 





证 移 
Translatef (0.0,0.0, -8.0) 


份 别 绕 x.y.z 轴 旋转 

lotatef (self.x,1.0,0.0,0.0) 
Fotatef (self.y,0.0,1.0,0.0) 
Potatef (self.2,0.0,0.0,1.0) 


阁 方 向 等 比例 缩放 
lscalef (self.s, self.s, self.s) 


艇 制 茶壶 
格 IColor3f (0.8,0.3,1.0) 
glutsolidreapot (1.0) 


GitSwapeuffers() 


ef InitGr (self,width, height) : 
制 始 化 窗口 背景 为 白色 
glClearcoolorQL.0,1.0,1.00.0) 
glclearpepth 01.0) 
四 DepthFunc (GL, IEsS) 
山 置 材质 与 光源 属性 
mat_ sp=(1.0,1.0,1.0,1.0) 
mat_ sh=[50.0] 
light positim=( -0.5,1.5,1,0) 
yellow 1=(,0.7,0,1) 
ambient =(0.1,0.8,0.2,1.0) 
IMaterialfv (GL, FECNT,GL SPROULAR, Mat: sp) 
glMaterialfv (GL, FFONT, GL SHININESS,mat sh) 
llightfv (GL, LIGHTO, GL, FOSTTION, 1ight positicn) 
llightfv (GL LIGHTO, GL, DIFFUSE, yellow 1) 
lightfv (GL, LIGHIO, GL, SPECULAR, yellow 1) 
lightMdelfy (GL LIGHT MDET AMBITENT, anbient) 
编 用 光照 模型 
lenable (GL LIGHTINS) 
glEnable (GL LIGHTO) 
lenable (GL TEPIH TEST) 
紫 滑 泻 染 
lenable (GD, FIEND) 
lshaceMmdel (EL, SMOOTH) 
lenable (GL FOINT SMOOTH) 
lerable (GL LNE SOOTH) 
glEnable (GL POLYGCN SMOOITH) 
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glMatrixpoe (GL FFOJECTION) 

玻 走样 ,也 称 为 抗 锯齿 

lHint (GL FONT SMOOTH HINT,GL NICEST) 

lHint (Gb IINE SOOTH HINT, GL NICEST) 

lHint (GL FEOTYGCN SMOOTH HINT,GL FASIEST) 
glIcacraentity() 

睁 视 投影 变换 

gluperspective (45.0, float (width) /float height) ,0.1,100.0) 
glMatrixMbae (GL MOCETWIEW) 


附录 D 图 像 编程 


Python 扩展 库 pillow 提供 了 非常 强大 的 图 像 处 理 有 关 的 功能 ,支持 BMP PNG JPEG 、 
GIF 等 多 种 图 像 格 式 。 该 扩展 库 主 要 提供 了 Tmage、ImageChops、ImageColor、 .ImageDraw 、 
ImagePath ImageFile 、 ImageGrab ImageTk 、ImageEnhance 、.PSDraw 以 及 其 他 一 些 模块 来 支 
持 图 像 处 理 有 关 的 操作 ,而 ImageGrab 模块 还 支持 对 屏幕 指定 区 域 进行 截图 。 在 我 的 另 
外 一 本 书 《Python 可 以 这 样 学 》( 清华 大 学 出 版 社 ,书号 为 9787302456469 ) 中 介绍 了 大 量 
的 pillow 应 用 ,这 里 就 不 再 重复 了 ,再 给 出 两 个 新 的 案例 。 下 面 的 代码 可 以 批量 为 指定 文 
件 夹 中 所 有 图 像 添 加 数字 水 印 。 

fram random inport randint 

fram os inport listdir 

fram PIL import Trace 


林 开 并 读 取 其 中 的 水 印 像素 ,也 就 是 那些 不 是 白色 背景 的 像素 
赚 到 内 存 中 , 放 到 字典 中 以 供 快速 访问 

im=Irege.open ("watemrark.brp') 

Pizels =dict () 


for w in range (width) : 
for h in range (height) : 
cim.getpixel ((w,h)) [:3] 
if c! =055,255,255) : 
Pixels[ (Ww,h)] 一 
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Gef adWatiervark (srcpir) : 
雁 取 当前 所 有 Be 图 像 文 件 列表 
PicPiles=[fn for fn in listdir (rcpir) if fn.endswith((' .bp -jpg -ng))] 
稀 历 所 有 文件 ,为 每 个 图 像 添加 水 印 
for fn in picFiles: 
iml =Imege.qpen (Fn) 
wh =im .size 
效果 图 片 尺寸 小 于 水 印 图 片 , 不 加 水 印 
if w<width or h <height: 
Contimue 
首 原 始 图 像 左 上 角 .中 间或 布下 角 添 加 数字 水 印 
得 体位 置 根据 Positicn 进行 随机 选择 
p={0: (0,0) ,1: ((w -width) //2, -height) //2) ,2: (w -width,h -height)} 
Eosition randint (0,2) 
top, left =p.get (position, (0,0)) 
艇 改 像素 值 ,添加 水 印 
for p,c in Pixels.items (): 
iml .Putpixel ( (PI0] +top,p[1] Heft),c) 
娩 存 加 入 水 印 之 后 的 新 图 像 文 件 
iml .save (fn[: -4] +' new' +fn[ 4:]) 


盎 当 前 文件 夹 中 的 图 像 文件 添加 水 印 

accWaterMark ('.') 

下 面 的 代码 用 来 把 水 印信 息 打 散 后 添加 到 图 像 中 的 随机 位 置 ,并 可 以 重新 把 水 印信 
息 提 取出 来 。 

fram os inport remove 

fram os .path inrport isfile 

fram random inrport sanple, dpice 

fram PIL irport JrecP 


GEf mergeWaterMark (originPic, watemrarkPic, J]ogTxt) : 
寻 始 图 片 和 水 印 文件 必须 为 图 片 格式 
if ((not originpic.endswith(('.jpg',' .bm .pn9'))) or 
(net watemrerkPic.endswith((' .jpg',' .bm .pg9)))): 
retim "Error fomat." 


打开 原 图 和 水 印 图 片 ,并 获取 大 小 
jnmorigin =Imege.qpan (originpic) 
inWaterMark =Irege .open (watemrarkPic) 


葵 机 生成 水 印 位 置 
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allFositicons =[ (w,h) for w in range (crigirWidHh) for h in range (originHeight)] 
Positions =sanple (allPositions, watemrerkWidHh * watenrerkHeight) 


frog=pen (10gTxt, 'w') 
枉 入 水 印 文件 大 小 
fog-write (str ( watermrerwiath ,watermerteight)) + \n') 


for w in range (watermariWidth) : 
for h in range (watermarkHeight) : 
Cc =inmWaterMark.getpixel ( (w,h)) 
c=c[:3] 
枫 写 和 人 不 是 白色 的 像素 
if c !=255,255,255) : 
P =chpice (positicns) 
妈 入 像素 值 
jimorigin.Putpixel (p, ©) 
娩 免 重复 修改 同一 个 像素 
Positins.remve (p) 
性 成 日 志文 件 , 用 来 提取 水 印 
fprog.write (str (p+(w,h)) +'\n') 
fog.close0 
性 成 加 入 水 印 的 新 图 片 
inorigin.save (originpic[: -4] +， new' +originpic[ -4:]) 


GEf restoreWaterMark (mergedPic, 1ogTxt, watemrarkpic) : 
琐 先 删除 原来 提取 过 的 水 印 文件 
if isfile watermarkPic) : 
IErove (watiermarkPpic) 
inMerged =Irage .apen tmergedpic) 
with cpen (10gPt) as fp: 
fer line in fp: 
赎 取 每 一 行 并 还 原 为 元 组 
line =eval (line.strip()) 
第 一 行 是 水 印 图 片 尺寸 , 先 创建 水 印 文件 
if lan(line) = 之 : 
inWaterMark =Irege .new ('FGB', line, (255,255,255)) 
else: 
租 取 水 印 像素 并 写 和 水印 文 件 
C=inMerged.getpixel ((line[0], line[1])) 
c=c[:3] 
inwaterMark.putpixel ( (line[2], line[3]),c) 
于 存 提取 的 水 印 
inwatervark. save (watemrarkpic) 





附录 ”精彩 在 继续 = 383 
®® 


条 加 水 印 
mergewatervark ('origin.bmp"', "watenmrark.png', "109g-txt') 
能 取水 印 








(origin new.hmp', "cgg-bxtv -png') 


附录 玉 数据 分 析 、 机 器 学 习 、 科 学 计算 可 视 化 


用 于 数据 分 析 与 科学 计算 可 视 化 的 Python 模块 非常 多 ,例如 numpy 、scipy 、pandas 、 
statistics .matplotlib ,sympy 、 traits ,traitsUI、 Chaco .TVTK 、 Mayavi .VPython .OpenCV。 其 中 ， 
numpy 模块 是 科学 计算 包 , 提 供 了 Python 中 没有 的 数组 对 象 ,支持 N 维 数组 运算 、 处 理 大 
型 矩阵 成熟 的 广播 函数 库 .矢量 运算 .线性 代数 、 傅 里 叶 变 换 以 及 随机 数 生成 等 功能 ,可 
与 C++ 、FORTRAN 等 语言 无 颖 结合 , 树 莓 派 Python v3 默认 安装 就 已 包含 了 numpy。 
scipy 模块 依赖 于 numpy ,提供 了 更 多 的 数学 工具 ,包括 和 矩阵 运算 线性 方程 组 求解 积分、 
优化 等 。matplotlib 是 比较 常用 的 绘图 模块 ,可 以 快速 地 将 各 种 计算 结果 以 各 种 图 形 形 式 
展示 出 来 。OpenCV 是 一 个 实时 的 计算 机 视觉 工具 包 , 提 供 了 大 量 相 关 的 功能 ,已 经 成 为 
事实 上 的 标准 工具 。 

近 几 年 来 ,大 数据 机 器 学 习 ,深度 学 习 等 领域 推出 了 大 量 并 行 计 算 和 利用 GPU 加 速 
的 模块 ,例如 pycuda .pyopencl .theano ,scikit-learn .NumbaPro .pySpark .TensorFlow。 除 了 本 
书 第 12 章 中 关于 pySpark 和 GPU 并 行 计 算 的 介绍 ,在 作者 的 另 一 本 书 《Python 可 以 这 样 
学 》( 书 号 : 9787302456469 ) 和 微 信 公众 号 “Python 小 屋 " 也 有 一 些 科学 计算 可 视 化 的 案 
例 代码 可 以 参考 。 

Python 的 大 部 分 扩展 库 都 可 以 使 用 pip 命令 直接 安装 ,如 果 有 不 能 安装 或 者 安装 之 
后 无 法 正常 工作 的 扩展 库 , 可 以 登录 下 面 的 网 页 选择 合适 的 版 本 下 载 和 安装 : 


http://www.lfruci .eay ~ gchlke/pythonlibs/ 


附录 密码 学 编程 








除了 自己 设计 加 密 算法 或 者 自己 编写 程序 实现 经 典 的 加 密 解 密 算法 之 外 ,还 可 以 充 
分 利用 Python 标准 库 和 扩展 库 提供 的 丰富 功能 。Python 标准 库 hashlib 实现 了 SHA1 、 
SHA224 .SHA256 .SHA384 .SHA512 以 及 MD5 等 多 个 安全 哈 希 算法 ,标准 库 zlib 提供 了 
adler32 和 erc32 算法 的 实现 ,标准 库 hmac 实现 了 HMAC 算法 。 在 众多 的 Python 扩展 库 
中 ,pycryptodome 可 以 说 是 密码 学 编程 模块 中 最 成 功 也 是 最 成 熟 的 一 个 ,封装 了 密码 学 有 
关 的 大 量 算法 ,具有 很 高 的 市 场 占有 率 。 另 外 ,cryptography 也 有 一 定数 量 的 用 户 在 使 用 。 
扩展 库 pycryptodome 和 cryptography 提供 了 SHA 系列 算法 和 RIPEMD160 等 多 个 安全 哈 
希 算法 ,以 及 DES 、AES .RSA .DSA .ElCamal 等 多 个 加 密 算 法 和 数字 签名 算法 的 实现 。 


附录 G 系统 运 维 


系统 运 维 涉及 的 内 容 非常 广泛 ,例如 内 存 、CPU 、 网 络 带 宽 等 资源 占用 率 以 及 磁盘 配 
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额 情况 的 实时 查看 ,进程 列表 .线程 列表 以 及 用 户 文件 变化 情况 的 动态 跟踪 ,网 络 主机 卫 
地 址 的 动态 分 配 与 回收 以 及 DNS 管理 ,用 户 文 件 变化 情况 ,病毒 防护 与 人 侵 检 测 ,必要 的 
时 候 给 系统 管理 员 发 送 邮 件 , 历 史 数 据 永 久 化 以 及 相关 图 表 生 成 ,等 等 。 当 然 , 严 格 来 说 ， 
保持 供电 和 供水 系统 的 正常 工作 也 属于 系统 运 维 的 范畴 ,不 过 这 些 内 容 不 在 本 书 讨论 范 
围 之 内 。 在 编写 系统 运 维 程序 时 常用 的 Python 标准 库 和 扩展 库 如 下 。 

(1) difflib: 可 以 比较 文件 差异 并 可 以 生成 不 同 格式 的 比较 结果 。 

(2) filecemp: 用 于 实现 文件 与 文件 夹 的 差异 比较 。 

(3) smtplib .poplib ,ftplib: 邮件 收发 与 FTP 空间 访问 。 

(4) ansible-playbook : 轻 量 级 多 主机 部 署 与 配置 管理 系统 。 

(5) dnspython: DNS 工具 包 , 支 持 几乎 所 有 记录 类 型 。 

(6) ipy: 用 于 管理 IPv4 和 IPv6 地 址 与 网 络 的 工具 包 。 

(7) paramiko: 提供 了 SSHv2 协议 的 服务 端 和 客户 端 功能 。 

(8) psutil: 可 以 获取 内 存 `. CPU .磁盘 网络 的 使 用 情况 ,查看 系统 进程 与 线程 信息 ， 
并 具有 一 定 的 进程 和 线程 管理 功能 。 

(9) pyclamad: 提供 了 免费 开源 杀毒 软件 Clam Antivirus 的 访问 接口 。 

(10) pyeurl: 对 libecurl 的 封装 ,类 似 于 标准 库 urllib ,但 功能 更 强大 。 

(11) python-rrdtool: 提供 了 rddtool 的 访问 接口 ,rddtool 主要 用 来 跟踪 对 象 的 变化 情 
况 并 生成 走势 图 ,例如 业务 的 访问 流量 .系统 性 能 .磁盘 利用 率 等 趋势 图 。 

(12) scapy: 交互 式 数据 包 处 理工 具 包 ,支持 各 种 网 络 数据 包 的 解析 和 伪造 。 

(13) xlrd .xlwt ,openpyxl: 支持 不 同 版 本 Excel 文件 的 读 写 操作 ,包括 数字 ,文本 、 公 
式 .图 表 。 


附录 H Windows 系统 编程 


绝 大 多 数 版 本 的 Linux 系统 中 都 内 置 了 Python 解释 器 ,而 在 Windows 平台 上 一 般 需 要 
单独 安装 ,尽管 如 此 ,Python 在 Windows 平台 上 的 表现 也 是 非常 不 俗 的 , 绝 大 部 分 标准 库 中 
的 功能 都 能 在 Windows 平台 上 使 用 ,并 且 还 拥有 大 量 专门 针对 Windows 的 扩展 库 。 

(1) etypes: Python 标准 库 ctypes 提供 了 访问 . dll 或. so 等 不 同类 型 动态 链接 库 中国 
数 的 接口 ,很 好 地 支持 了 与 C/C ++ 等 语言 混合 编程 的 需求 ,可 以 调用 操作 系统 底层 API 
函数 。 

(2) os: 可 以 调用 Windows 内 部 命令 和 外 部 程序 ,提供 了 一 定 的 文件 与 文件 夹 管理 
功能 以 及 进程 管理 功能 。 

(3) platform: 扩 平 台 的 标准 库 ,实现 了 与 系统 平台 有 关 的 部 分 功能 ,例如 查看 机 型 、 
CPU ,操作 系统 类 型 等 信息 。 

(4) winreg: 提供 了 用 于 操作 Windows 系统 注册 表 的 大 部 分 功能 。 

(5) wmi: 提供 了 Windows Management Instrumentation (WMI) 的 访问 接口 。 

(6) py2exe: 可 以 用 来 把 Python 程序 打包 成 可 以 脱离 Python 解释 器 环境 并 独立 运行 
在 Windows 平台 上 的 可 执行 程序 。 
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(7) pywin32: 包括 win32api、win32process .win32api、win32con .win32gui win32evtlog 、 
win32security .winerror 等 大 量 模块 ,对 Windows 底层 API 进行 了 完美 的 封装 ,几乎 支持 
Windows 平台 上 的 所 有 操作 。 

为 了 方便 教学 ,作者 使 用 Python 开发 了 一 套 教 学 管理 软件 ,具有 在 线 点 名 .提问 、 答 
疑 、 交 作业 自 测 ,在线 考试 .数据 导入 导出 与 汇总 .Word 试卷 生成 等 多 个 功能 ,其 中 在 线 
考试 系统 具有 防 作弊 的 功能 ,不 少 人 觉得 很 神奇 ,其实 思路 和 代码 都 很 简单 。 主要 的 原理 
是 关闭 文本 编辑 器 并 定时 清空 系统 剪贴 板 , 不 允许 复制 题目 和 其 他 任何 内 容 , 也 不 允许 打 
开 浏览 器 搜索 网 页 ,只 能 一 个 题 一 个 题 地 做 ,并 且 每 个 人 都 是 随机 抽 题 ,题库 里 有 700 多 
道 题 , 所 以 相 邻 的 两 个 人 同一 时 间 抽 到 同一 题 的 概率 非常 小 ,有 效 防 止 了 作弊 。 下 面 的 代 
人 码 模拟 了 这 个 功能 , 单 击 “ 开 始 考试 "按钮 启用 考试 模式 的 防 作 准 功能 , 单 击 “ 结 束 考试 ” 
则 禁用 防 作 兹 功能。 代码 主要 使 用 了 标准 库 ctypes 和 扩展 库 psutil 中 的 部 分 功能 。 

inport cs 

import time 

import tkinter 

import threading 

jimport ctypes 

irport Psutil 

roct tkinter.Tk() 

zcct.title(' 防 作弊 演示 : 

入口 初始 大 小 和 位 置 

IToct.geametry ("250x80 +300 +100"') 

杯 允 许 改变 窗口 大 小 

rooct.resizable (False, False) 

jinyong -tkinter.Intvar (root,0) 





py 芋 付 国 ') 


GEf fincJinyong(): 

while jinyong.gat () = 了 本: 

巍 行 关闭 主流 文本 编辑 器 和 网 页 浏览 器 
for pid in peutil .pids () : 

try: 

Pp Psutil .Prooess (pid) 
exENEre =05 .path.basenamre (Pp.exe ()) .lower () 
if exeNere in ('notepad.ee', wirword.ese', 


P-lGl110 
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pess 
精 空 系统 剪贴 板 

Ctypes .windl] .user32 .QperClipiboard Nene) 
Ctypes .windl] .user32 .Hptyclipiooard () 
ctypes .windl] .user32.CloseClipiooard() 
time.slesp(1) 


GEf start(): 
jinyeng.set (1) 
t =threading.Thread (target =funcJinyong) 
七 start () 


buttonstart =tkinter.Button (root, text =' 开 始 考试 ', cqmrend =start) 
buttonstart .place (x=20,y 340,width 400,height -20) 


buttcnstop =tkinter.Buttcn (roct, text =" 结 束 考试 ', cqmrand =stop) 
buttcnstop.Place (x 430,y340,width 400, height =20) 


模拟 用 ,开启 考试 模式 以 后 ,所 有 内 容 都 不 青 允 许 复 制 
entryMessage tkinter .Entry (roct) 
entryMessage .place (x 310,y =40,widHh =230, height =20) 


roct .mainlop() 
附录 工 软件 分 析 与 逆向 工程 


在 软件 分 析 和 逆向 工程 领域 ,有 大 量 的 成 熟 工具 以 及 针对 不 同 工 具 和 目的 开发 的 各 
种 插件 , 例如 IDA Pro、OllyDbg、WinDbg、W32DASM 、PEid 、ssdeep 、DiStorm 、DisView 、 
LordPE .PIN .Universal PE Unpacker .Sample Chart Builder 等 ,可 以 说 是 数不胜数 。 下 面 简 
单列 出 使 用 Python 开发 或 可 以 使 用 Python 进行 二 次 开发 的 工具 和 插件 。 

(1) PyEmu: 可 编写 脚本 的 模拟 器 ,对 恶意 软件 分 析 非 常 有 用 。 

(2) Immunity Debugger: 著名 的 调试 器 ,是 在 OllyDbg 的 源 代码 基础 上 建立 起 来 的 ， 
外 观 和 用 法 都 与 OllyDbg 非常 相似 ,并 且 两 者 共享 很 多 的 底层 功能 和 控制 。Immunity 
Debugger 带 有 内 置 的 Python 接口 和 专门 用 于 研究 漏洞 和 执行 恶意 软件 分 析 的 强大 API， 
是 可 编写 脚本 的 GUI 和 命令 行 软件 调试 器 ,支持 exploit 编写 二进制 可 执行 文件 逆向 工 
程 等 各 种 应 用 。 

(3) Paimei: 完全 使 用 Python 编写 ,是 非常 成 熟 的 逆向 工程 框架 ,包括 PyDBG .PIDA、 
pGRAPH 等 多 个 可 扩展 模块 ,可 以 执行 大 量 静 态 分 析 和 动态 分 析 ,例如 模糊 测试 .代码 覆 
盖 率 跟踪 .数据 流 跟踪 等 。 

(4) ropper: 比较 成 熟 的 ROP Gadgets 查找 与 可 执行 文件 分 析 工 具 , 其 反 汇 编 部 分 使 
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用 了 成 熟 的 Capstone 框架 。 

(5) WinAppDbg: 纯 Python 调试 器 ,没有 本 机 代码 ,使 用 ctypes 封装 了 许多 与 调试 器 
有 关 的 Win32 API 调用 ,并 且 为 操作 线程 和 进程 提供 了 强 有 力 的 抽象 。 利 用 该 工具 可 以 
将 自己 编写 的 脚本 附加 为 调试 器 .跟踪 执行 .拦截 API 调用 ,以 及 在 待 调试 进程 中 处 理事 
件 , 并 且 可 以 设置 各 种 断 点 。 

(6) YARA: 恶意 软件 识别 和 分 类 引擎 也 可 以 利用 YARA 创建 规则 以 检测 字符 串 、 入 
侵 序列 .正则 表达 式 、 字 节 模 式 等 。 既 可 以 使 用 命令 行 模式 下 的 yara 工具 扫描 文件 ,也 可 以 
利用 YARA 提供 的 API 函数 将 yara 扫描 引擎 集成 到 C 或 Python 语言 编写 的 工具 中 。 

(7) pefile: 可 以 读 取 和 处 理 PE 文件 。 

(8) IDAPython: IDA 插件 ,IDAPython 是 运行 于 交互 式 反 汇 编 器 IDA 的 插件 ,用 于 实 
现 IDA 的 Python 编程 接口 。IDA 在 逆向 工程 领域 具有 广泛 的 应 用 ,尤其 是 二 进 制 文件 静 
态 分 析 ,其 强大 的 反 汇 编 功 能 一 直 处 于 业内 领先 水 平 。IDAPython 插件 使 得 Python 脚本 
程序 能 够 在 IDA 中 运行 并 实现 自 定 义 的 软件 分 析 功 能 ,通过 该 插件 运行 的 Python 脚本 程 
序 可 以 访问 整个 IDA 数据 库 , 并 且 可 以 方便 地 调用 所 有 IDC 函数 和 使 用 所 有 已 安装 的 
Python 模块 中 的 功能 。 目 前 IDAPython 还 不 支持 Python3 , 较 高 版 本 的 IDA 中 集成 了 
IDAPython 插件 ,如 果 需 要 安装 或 升级 ,需要 登录 其 官方 网 站 下 载 安装 适合 已 安装 Python 
和 IDA 版 本 的 IDAPython 插件 。 

(9) Hex-Rays Decompiler: IDA 插件 ,非常 成 熟 的 反 编 译 插件 。 

(10) PatchDiff2: IDA 插件 ,主要 用 于 补丁 对 比 。 

(11) BinDiff: IDA 插件 ,主要 用 于 二 进 制 文件 差异 比较 。 

(12) hidedebug: Immunity Debugger 插件 ,可 以 隐藏 调试 器 的 存在 ,用 来 对 抗 某 些 通 
用 的 反 调 试 技术 。 

(13) IDAStealth: IDA 插件 ,可 隐藏 IDA debugger 的 存在 ,用 来 对 抗 某 些 通用 的 反 调 

(14) MyNav: IDA 插件 ,能 够 帮助 逆向 工程 师 完成 一 些 最 典型 的 任务 ,例如 发 现 一 些 
特定 功能 或 任务 是 由 哪些 函数 实现 的 , 找 出 补丁 前 后 函数 的 不 同 之 处 和 数据 入 口 。 

(15) Lobotomy: 一 款 应 用 于 Python 的 安 卓 渗透 测试 工具 包 , 可 以 帮助 安全 研究 人 员 
评估 不 同 Android 逆向 工程 任务 。 

特别 需要 注意 的 是 ,应 尽量 避免 直接 在 本 地 物理 主机 上 分 析 恶 意 软 件 , 以 免 被 恶意 软 
件 感染 而 造成 不 必要 的 损失 。 为 了 保证 物理 主机 安全 ,同时 也 为 了 能 够 在 分 析 环 境 被 恶 
意 软 件 感染 之 后 快速 恢复 系统 ,建议 使 用 VirtualBox ` VMware .QEMU 等 虚拟 机 系统 或 沙 
箱 系 统 进行 保护 。 如 果 没 有 条 件 使 用 虚拟 机 或 沙 箱 系统 ,最 好 使 用 Deep Freeze、Truman 、 
FPG 或 其 他 类 似 软件 来 保护 物理 主机 以 防止 系统 被 感染 。 
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